logo of meituan

美团【LongCat实习】大模型算法研究员-Search Agent方向

实习兼职核心本地商业-基础研发平台地点:北京 | 上海状态:招聘

任职要求


1.全球 Top 高校计算机科学、人工智能、数学或相关领域博士或硕士;
2.在 NeurIPSICMLICLRACLEMNLP等大模型领域顶级会议以第一作者发表过论文,研究方向与大语言模型、强化学习、Agent、多模态模型等强相关;
3.在大语言模型、强化学习、Agent、多模态等方向中至少一个领域有扎实的理论基础与实践经验,能独立完成从问题定义、方法设计、系统开发、实验验证的完整工作闭环,并深度使用AI工具辅助完…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


你将加入 LongCat Agent 算法团队,与一线研究员共同推进下一代智能体的范式探索。具体方向包括但不限于:
1.Agentic RL 基础算法研究:探索面向长程多步任务的强化学习训练范式,包括稀疏奖励下的信用分配、过程奖励建模、自我博弈与多智能体协同、可扩展的 reward modeling,以及训练稳定性与样本效率优化。目标是实现Agent 能力增长的主引擎;
2.Search Agent 能力构建:研发面向开放域复杂查询的搜索智能体,覆盖多轮检索规划、查询改写、证据聚合、多源信息冲突消解与可信溯源。重点突破"深度研究"类长程任务(Deep Research)的端到端 RL 训练,让模型在数十步检索-推理交织中保持目标产出高质量分析内容。
3.生活服务助理 Agent:解决美团真实业务环境中(餐饮、出行、到店、履约等多业务横跨)实现智能助理的基础问题,研究多工具长链调用、澄清和主动服务、个性化记忆与偏好建模、跨会话状态管理,以及面向真实用户反馈的RL 闭环。这里的复杂度来自亿级用户、千万级 SKU 与多步骤决策构成的真实环境。
【为什么是我们】
1.稀缺场景:直接接触亿级真实用户、跨业务多步决策的复杂环境,是当前业界最稀缺的 Agent 训练土壤;
2.充足资源:充足算力、丰富多模态数据、专属带教导师、顶级 infra 团队支持;
3.研究自由:明确鼓励技术探索,有机会参与顶会论文产出,研究成果可服务亿级真实用户实现学术与产业双闭环;
4.成长路径:北京 / 上海双地 base,扁平协作、与算法/Infra/产品高密度共事,快速成长为下一代 Agent 技术骨干。
包括英文材料
NeurIPS+
ICML+
ACL+
EMNLP+
还有更多 •••