美团【LongCat实习】AI 自进化与自动化研究算法研究员

实习兼职核心本地商业-基础研发平台2026-06-26地点：北京 | 上海状态：招聘

扫码手机上打开

任职要求

必备项：
1. 具备扎实的算法基础和工程实现能力，熟练使用 Python/C++，能够独立完成复杂系统设计、实验实现和问题定位。
2. 熟悉大语言模型、Agent、强化学习、代码生成、检索增强、训练/评测系统中的至少一个方向，并有真实项目经验。
3. 具备强研究能力和问题拆解能力，能够从开放问题中提出可验证假设，设计实验并推动结果落地。
4. 具备良好的沟通协作能力，能在高不确定性前沿方向中持续推进。
加分项：
1. 有 Coding…

登录查看完整任职要求

微信扫码，1秒登录

工作职责

我们相信，AI 研发本身，是下一个被 AI 加速和重塑的领域。美团 LongCat 团队正在探索下一代 AI 自进化与自动化研究系统：让模型不仅能够完成任务，也能够参与模型研发过程本身，围绕问题发现、假设生成、实验执行、结果验证、经验沉淀与策略迭代，形成持续改进的研究闭环。加入我们，你将参与构建以研究智能体为核心，联动可验证研究环境、训练与评测体系、研究策略库的 AI for AI 系统，并将自动化研究能力反哺到模型自身的训练、评测与迭代中，推动“用 AI 研发更强 AI”的长期目标。

1. 自动化研究智能体能力建设
参与提升模型在复杂任务分解、长程推理、研究规划、工具使用、代码生成与执行、证据整合、结果归因与研究报告生成等方面的闭环能力，并在真实模型研发任务中验证效果。
2. 长程上下文、记忆与状态管理
探索 context scaling / compression、memory selection、任务状态追踪等机制，解决长周期任务中的一致性衰减、状态丢失、中断恢复与长期依赖管理问题。
3. 可验证研究环境与自动实验闭环
构建覆盖 search、browser、retrieval、code execution、training / eval job、sandbox 等能力的交互式研究环境，将研究任务建模为可交互、可验证、可评分的闭环，支持自动实验编排、结果比对与版本回滚。
4. 训练策略与反馈信号设计
设计数据配方、环境反馈、过程监督与 reward 信号体系，结合 SFT、强化学习等方法，引导模型在事实正确性、工具调用可靠性、任务完成率与研究轨迹质量上持续提升。
5. 评测体系与错误分析闭环
建设面向真实 research workflow 的 benchmark 与自动评测体系，系统分析研究智能体在规划、检索、工具调用、上下文管理、实验执行、结果归因等环节的典型失败模式，并反哺训练策略与 harness 优化。
6. 研究经验沉淀与策略自进化
将成功与失败任务轨迹沉淀为 research episode、skill、eval case 等可检索、可复用、可训练的经验资产，支持模型在后续任务中检索、复用、迁移与迭代，推动研究策略的持续自进化。

📮 投递简历 ✨AI模拟面试

难度：

包括英文材料

算法+

Python+

C+++

系统设计+

还有更多 •••

登录查看完整学习资料