logo of meituan

美团【北斗】基座大模型算法研究员(预训练/原生多模态/智能体系统)

校招全职核心本地商业-基础研发平台地点:北京 | 上海状态:招聘

任职要求


预训练
1.熟悉NLPLLM、MLsys、Optimization、Operations research、Control、RL、应用数学等领域,对其中一个或多个方向有深入的研究经历,且有相关实际项目经验;
2.熟悉PythonC++等至少一门编程语言,熟悉Linux环境;
3.熟悉PytorchMegatronDeepSpeed 等开源训练框架;
4.对大模型原理和技术探索有热情和信心,敢于挑战不确定性强的研究问题。
加分项:
1.发表过相关方向高水平论文(如NeurIPS, ICLR, ICML等);
2.有实际的大模型预训练经验;
3.有影响力的开源项目中做出过核心贡献。

原生多模态
1.多模态大模型、强化学习或具身智能等方向有深入的理解以及扎实的研究/项目经历;
2.熟悉主流的多模态模型、视频理解模型或具身智能框架、RL算法。对两者交叉领域有深入思考或实践者优先;
3.具备强烈的好奇心、出色的创新思维、卓越的问题解决能力以及引领技术突破的雄心

智能体
1.对RL、Agentic Coding、DeepResearch其中一个或多个方向…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


预训练
探索下一代大模型预训练范式,从模型结构、训练策略、数据策略、算力利用率等角度切入,打造具有更强能力和更高潜力的基座模型。
1.设计更高效的模型结构,提高给定数据量、计算量、参数量、序列长度等约束下的模型能力,如长序列能力、记忆能力、推理能力等;
2.探索更科学的训练策略,对影响training dynamic的关键变量(如学习率、batchsize、初始化等)形成更科学的认知,探索更适合大模型的optimizer等;
3.研究模型结构和数据的耦合关系;探索预训练与上下游环节的联合优化;改进分阶段训练范式;
4.结合MLsys解决大规模训练和推理中遇到的卡点问题,实现算法和工程联合设计。

原生多模态
1.负责面向真实世界数据(尤其是大规模视频序列、图文交错数据等)的原生多模态大模型的架构设计与预训练技术探索。攻坚多模态信息(视觉、语言、音频、触觉等)的深度融合、统一表征与跨模态生成。借助更大规模自监督学习范式,驱动模型学习多模态序列分布,致力于让模型从海量数据中学习世界运行的规律、物理交互知识与通用技能;
2.设计并优化适用于原生多模态架构的表征构建与学习方案,以增强模型对多模态Token的深层理解、采样与复杂推理能力。结合SFT/RL等后训练探索,激发模型采样多模token,解决物理世界问题能力;
3.负责将原生多模态大模型学到的丰富先验知识高效迁移并赋能具身智能体。主导或参与强化学习(RL)、模仿学习(IL)、规划与控制算法的设计与优化,显著提升智能体在模拟及真实机器人上的学习效率、任务成功率与自主决策能力;
4.负责设计并与工程团队紧密协作搭建高逼真度、可扩展的具身智能模拟环境,产出多样化、高质量的合成交互数据,为强化学习算法的训练、测试以及Sim-to-Real研究提供坚实的数据与环境基础。

智能体系统
1.研发端到端训练、能够自主处理问题、具备完整工具使用能力的智能体(Agent)系统,在Agentic Coding、DeepResearch等各类端到端任务上取得突破。
2.探索能够自主与环境交互,自适应学习并持续提升的智能体(Agent)系统,提升大模型解决现实问题的能力。
包括英文材料
NLP+
大模型+
Python+
C+++
Linux+
PyTorch+
Megatron+
DeepSpeed+
还有更多 •••
相关职位

logo of meituan
社招5年以上软硬件服务-骑行

1、负责共享两轮车电气件的硬件开发。 2、根据产品需求完成电气系统设计、硬件方案设计,编写设计文档。 3、负责关键电子元器件物料选型、原理图绘制和电路板布局布线,BOM确认,进行样板焊接和调试。 4、配合软件、结构、测试等部门完成产品开发和产品验证,跟进并解决生产问题。 5、跟踪存量产品的市场问题,制定并落地解决方案。 6、跟踪行业新标准和技术动态,参与新技术预研和应用。

更新于 2025-04-01深圳|北京
logo of amap
社招6年以上技术类-开发

信息工程介绍:构建空间智能商业引擎,支撑高德日均调用北斗定位4800亿次,我们在商业服务领域面临多重极端技术挑战;节假日搜索系统需承载超百万QPS峰值请求,同时保障更新99.999% SLA;实时管理海量动态服务节点(从充电桩状态到酒店房态),时空数据更新毫秒级延迟。 1、提升交易稳定性、数据一致性、缩短RT等; 2、业务层面打造交易平台,支持业务快速试错、迭代,提升产研效率,快速助力业务KPI的达成。 3、负责高德基于LBS本地生活类业务(例如:酒店、门票、加油充电、美食生服)的营销运营体系建设,营销引擎、增长相关系统研发和迭代。 4、参与系统稳定性保障体系的建设,包括系统风险识别与优化、稳定性工具沉淀,保障大促及平时业务系统稳定、高效运转 5、负责协调上下游团队,推动项目高效、有序落地。

更新于 2025-06-27北京
logo of jd
校招多模态大模型与应

1、研究大模型(如 GPT、BERT 等)在定位多径和多模态定位中的应用可能性。探索如何利用大模型强大的学习能力和泛化能力,对复杂的定位数据进行特征提取、模式识别和预测分析 2、深入研究定位多径问题,包括但不限于卫星定位(如 GPS、北斗)、无线定位(如 Wi-Fi、蓝牙)等场景下的多径传播机制,提升定位精度到米级别 3、深入钻研 RTK(实时动态)载波相位差分技术,对其核心算法进行优化与创新。研究多系统(如 GPS、北斗、GLONASS 等)融合下的 RTK 定位算法,通过改进算法提高定位的精度、可靠性和稳定性,复杂场景定位精度到1米

更新于 2025-06-10北京
logo of meituan
实习核心本地商业-业

【课题说明】 通用模型往往难以兼顾多样化的场景需求,容易出现泛化能力强但针对性不足的问题。针对这一挑战,本课题聚焦于研究面向具体业务或应用场景的强化学习训练优化策略,通过引入场景特定的奖励函数、环境建模和数据采样机制,提升模型在特定任务下的表现能力与适应性。课题重点突破模型在细粒度场景下的泛化能力不足、奖励稀疏、训练效率低等问题,为大模型的行业落地提供有力支撑。 【建议研究方向】 1.场景特定奖励设计:针对不同业务场景,定制化设计奖励函数,提升模型在目标任务中的表现能力。 2.环境模拟与数据生成:构建高保真场景模拟环境,开发高效的数据采样与生成机制,提升强化学习训练效率。 3.迁移与泛化能力增强:研究多场景迁移学习与元强化学习方法,提升模型从通用能力到场景定制能力的转化效率。 4.推理增强型RAG系统:基于图结构的知识融合、混合模型的协同推理架构和强化学习驱动的优化方法,进一步提升RAG系统能力。 5.基于价值观约束的大模型风险控制与安全防护。

更新于 2025-05-27北京