美团【LongCat实习】大模型算法研究员-Search Agent方向

实习兼职核心本地商业-基础研发平台2026-06-26地点：北京 | 上海状态：招聘

扫码手机上打开

任职要求

1.全球 Top 高校计算机科学、人工智能、数学或相关领域博士或硕士；
2.在 NeurIPS、ICML、ICLR、ACL、EMNLP等大模型领域顶级会议以第一作者发表过论文，研究方向与大语言模型、强化学习、Agent、多模态模型等强相关；
3.在大语言模型、强化学习、Agent、多模态等方向中至少一个领域有扎实的理论基础与实践经验，能独立完成从问题定义、方法设计、系统开发、实验验证的完整工作闭环，并深度使用AI工具辅助完…

登录查看完整任职要求

微信扫码，1秒登录

工作职责

你将加入 LongCat Agent 算法团队，与一线研究员共同推进下一代智能体的范式探索。具体方向包括但不限于：
1.Agentic RL 基础算法研究：探索面向长程多步任务的强化学习训练范式，包括稀疏奖励下的信用分配、过程奖励建模、自我博弈与多智能体协同、可扩展的 reward modeling，以及训练稳定性与样本效率优化。目标是实现Agent 能力增长的主引擎；
2.Search Agent 能力构建：研发面向开放域复杂查询的搜索智能体，覆盖多轮检索规划、查询改写、证据聚合、多源信息冲突消解与可信溯源。重点突破"深度研究"类长程任务（Deep Research）的端到端 RL 训练，让模型在数十步检索-推理交织中保持目标产出高质量分析内容。
3.生活服务助理 Agent：解决美团真实业务环境中（餐饮、出行、到店、履约等多业务横跨）实现智能助理的基础问题，研究多工具长链调用、澄清和主动服务、个性化记忆与偏好建模、跨会话状态管理，以及面向真实用户反馈的RL 闭环。这里的复杂度来自亿级用户、千万级 SKU 与多步骤决策构成的真实环境。
【为什么是我们】
1.稀缺场景：直接接触亿级真实用户、跨业务多步决策的复杂环境，是当前业界最稀缺的 Agent 训练土壤；
2.充足资源：充足算力、丰富多模态数据、专属带教导师、顶级 infra 团队支持；
3.研究自由：明确鼓励技术探索，有机会参与顶会论文产出，研究成果可服务亿级真实用户实现学术与产业双闭环；
4.成长路径：北京 / 上海双地 base，扁平协作、与算法/Infra/产品高密度共事，快速成长为下一代 Agent 技术骨干。

📮 投递简历 ✨AI模拟面试

难度：

包括英文材料

NeurIPS+

ICML+

ICLR+

ACL+

EMNLP+

还有更多 •••

登录查看完整学习资料