美团【基座大模型北斗实习】多模态后训练及 Agent 能力拓展

实习兼职核心本地商业-基础研发平台2026-04-03地点：北京状态：招聘

扫码手机上打开

任职要求

1、对前沿技术有强烈的探索欲，有出色的团队协作精神；
2、有OpenClaw、Claude code深度使用经验与产出优先；
3、…

登录查看完整任职要求

微信扫码，1秒登录

工作职责

简介：跟踪多模态后训练前沿方法（SFT / DPO / GRPO 等），快速完成技术预研与可行性验证，形成可落地的训练方案并推动模型迭代。
1、面向复杂业务场景（如多轮交互、长序列推理、跨模态 Agent 决策等），进行针对性的垂域数据建设与指令微调，持续提升模型在垂直场景下的表现上限。
2、建设后训练评估体系与数据飞轮，设计面向垂域场景的自动化评测基准，驱动"评测→数据→训练→评测"的闭环迭代。
3、探索多模态大模型与新一代Agent框架（Claude Code、OpenClaw 等）的深度结合，研究模型在工具调用、环境感知、多步规划等场景下的能力边界，推动多模态模型从"被调用"向"自主交互"演进，拓展智能体在真实复杂环境中的落地路径。

📮 投递简历 ✨AI模拟面试

难度：

包括英文材料

NeurIPS+

ICML+

还有更多 •••

登录查看完整学习资料