logo of meituan

美团【基座大模型北斗实习】多模态后训练及 Agent 能力拓展

实习兼职核心本地商业-基础研发平台地点:北京状态:招聘

任职要求


1、对前沿技术有强烈的探索欲,有出色的团队协作精神;
2、有OpenClaw、Claude code深度使用经验与产出优先;
3、…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


简介:跟踪多模态后训练前沿方法(SFT / DPO / GRPO 等),快速完成技术预研与可行性验证,形成可落地的训练方案并推动模型迭代。
1、面向复杂业务场景(如多轮交互、长序列推理、跨模态 Agent 决策等),进行针对性的垂域数据建设与指令微调,持续提升模型在垂直场景下的表现上限。
2、建设后训练评估体系与数据飞轮,设计面向垂域场景的自动化评测基准,驱动"评测→数据→训练→评测"的闭环迭代。
3、探索多模态大模型与新一代Agent框架(Claude Code、OpenClaw 等)的深度结合,研究模型在工具调用、环境感知、多步规划等场景下的能力边界,推动多模态模型从"被调用"向"自主交互"演进,拓展智能体在真实复杂环境中的落地路径。
包括英文材料
NeurIPS+
ICML+
还有更多 •••