美团【LongCat大模型人才校招】基础大模型 Post-training 算法研究员

校招全职核心本地商业-基础研发平台2026-06-03地点：北京 | 上海状态：招聘

扫码手机上打开

任职要求

1.全球Top高校计算机科学、人工智能、数学、物理或相关领域应届博士/顶尖硕士毕业生；
2.在大模型领域有研究基础，或参与过有影响力的开源项目，在ICLR/NeurIPS/ICML/ACL等顶会发表论文；
3.具备扎实的算法和数学理论基础及良好的编程基础，熟悉自然语言处理、生成式AI和机器学习等技术，对技术开发…

登录查看完整任职要求

微信扫码，1秒登录

工作职责

我们在探索通过数据优化及大规模RL的方式，持续提升模型的核心基础能力和复杂生产力场景解决困难问题的能力。让模型具备深度思考与可靠行动的特性，推动模型在真实复杂任务中实现从“会说”到“会做”的跨越。团队在以下方向上进行探索，若你对以下一个或者多个课题感兴趣均欢迎投递：
1）大模型核心基础能力优化
1.围绕指令遵循、幻觉缓解、复杂推理、智能体规划等关键能力，研究并开发高效的后训练与对齐方案。
2.深入分析模型行为，通过数据策略、奖励建模、训练范式创新等，系统性提升模型的可靠性与实用性。
2）大规模强化学习与多目标RL训练
1.研究大规模强化学习（RL）及多目标强化学习的训练方案，突破RL在超大模型上的训练稳定性与扩展性问题。
2.构建可长期演进、稳定高效的RL Scaling训练管线，从算法、系统、数据等多维度推动模型能力持续提升。
3）长周期场景下的复杂推理与工具调用
1.聚焦Long Horizon任务中的多步推理、工具使用与自主智能体能力，设计并实现前沿优化方案。
2.探索包括高质量数据合成、长上下文管理、长上下文强化学习、过程监督、搜索与规划结合等关键技术，提升模型在复杂真实场景下的表现。
【为什么是我们】
1.团队扁平，人才密度高，近年团队在ICLR、NeurIPS、ICML、ACL等顶会累计发表论文数十篇，团队员工获EMNLP/ACL等Outstanding Paper； 
2.参与大语言模型核心技术研发，接触大规模RL、超长上下文、分布式训练和推理优化等前沿技术； 
3.充足算力保障，拥有大规模分布式训练环境和丰富数据资源。

📮 投递简历 ✨AI模拟面试

难度：

包括英文材料

大模型+

ICLR+

NeurIPS+

ICML+

还有更多 •••

登录查看完整学习资料