logo of meituan

美团【LongCat实习】AI 自进化与自动化研究算法研究员

实习兼职核心本地商业-基础研发平台地点:北京 | 上海状态:招聘

任职要求


必备项:
1. 具备扎实的算法基础和工程实现能力,熟练使用 Python/C++,能够独立完成复杂系统设计、实验实现和问题定位。
2. 熟悉大语言模型、Agent、强化学习、代码生成、检索增强、训练/评测系统中的至少一个方向,并有真实项目经验。
3. 具备强研究能力和问题拆解能力,能够从开放问题中提出可验证假设,设计实验并推动结果落地。
4. 具备良好的沟通协作能力,能在高不确定性前沿方向中持续推进。
加分项:
1. 有 Coding…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


我们相信,AI 研发本身,是下一个被 AI 加速和重塑的领域。美团 LongCat 团队正在探索下一代 AI 自进化与自动化研究系统:让模型不仅能够完成任务,也能够参与模型研发过程本身,围绕问题发现、假设生成、实验执行、结果验证、经验沉淀与策略迭代,形成持续改进的研究闭环。加入我们,你将参与构建以研究智能体为核心,联动可验证研究环境、训练与评测体系、研究策略库的 AI for AI 系统,并将自动化研究能力反哺到模型自身的训练、评测与迭代中,推动“用 AI 研发更强 AI”的长期目标。

1. 自动化研究智能体能力建设
参与提升模型在复杂任务分解、长程推理、研究规划、工具使用、代码生成与执行、证据整合、结果归因与研究报告生成等方面的闭环能力,并在真实模型研发任务中验证效果。
2. 长程上下文、记忆与状态管理
探索 context scaling / compression、memory selection、任务状态追踪等机制,解决长周期任务中的一致性衰减、状态丢失、中断恢复与长期依赖管理问题。
3. 可验证研究环境与自动实验闭环
构建覆盖 search、browser、retrieval、code execution、training / eval job、sandbox 等能力的交互式研究环境,将研究任务建模为可交互、可验证、可评分的闭环,支持自动实验编排、结果比对与版本回滚。
4. 训练策略与反馈信号设计
设计数据配方、环境反馈、过程监督与 reward 信号体系,结合 SFT、强化学习等方法,引导模型在事实正确性、工具调用可靠性、任务完成率与研究轨迹质量上持续提升。
5. 评测体系与错误分析闭环
建设面向真实 research workflow 的 benchmark 与自动评测体系,系统分析研究智能体在规划、检索、工具调用、上下文管理、实验执行、结果归因等环节的典型失败模式,并反哺训练策略与 harness 优化。
6. 研究经验沉淀与策略自进化
将成功与失败任务轨迹沉淀为 research episode、skill、eval case 等可检索、可复用、可训练的经验资产,支持模型在后续任务中检索、复用、迁移与迭代,推动研究策略的持续自进化。
包括英文材料
算法+
Python+
C+++
系统设计+
还有更多 •••