logo of meituan

美团【基座大模型北斗实习】多模态大模型技术研究

实习兼职核心本地商业-基础研发平台地点:北京 | 上海 | 深圳状态:招聘

任职要求


1、具备视觉多模态大模型的预训练或后训练研究经历;
2、熟悉PyTorch,有充分的动手实践经验。

加分项:
1、社区影响力:在多模态大模…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


简介:参与多模态大模型方向的前沿研究,可根据个人背景和研究兴趣选择以下方向之一深入推进:
1、多模态预训练与后训练技术创新,提升模型在 OCR、文档图表解析、Visual Grounding、细粒度感知、视觉问答等核心任务上的能力上限。
2、多模态强化学习方案设计,实现视觉感知与多模态理解场景下的高性能可信输出与幻觉抑制。
3、视觉推理能力增强研究(Visual CoT、PRM 等),提升模型在复杂视觉任务上的推理深度。
4、工具调用与 Agent 能力构建,探索多模态模型在规划决策场景中的综合表现。
5、长上下文视觉理解与 GUI 能力研究,提升模型在长程复杂任务上的综合能力。
6、其他你坚信路线正确的多模态大模型前沿方向。
包括英文材料
大模型+
PyTorch+
还有更多 •••