美团视觉Agent大模型算法专家

社招全职核心本地商业-基础研发平台2025-06-22地点：北京 | 上海状态：招聘

扫码手机上打开

任职要求

1. 计算机科学、人工智能、电子工程等相关专业硕士及以上学历，具有计算机视觉或视觉Agent相关研发经验。

2. 扎实的算法基础，熟悉主流视觉模型及多模态大模型，具备模型调优与轻量化部署经验。

3. 深入理解主流Agent框架原理，在任务规划、工具调用、策略优化等方向有实际项目经验；

4…

登录查看完整任职要求

微信扫码，1秒登录

工作职责

1. 负责视觉Agent系统的全链路设计与开发，构建融合多模态感知、动态决策与自动化执行的视觉智能系统，推动复杂场景下的图文多模态/视频理解、交互与生成能力。

2. 负责视觉Agent核心算法的研发与优化，包括但不限于多模态大模型视觉感知、图像生成、多模态对齐（如文本-图像-视频）等方向，持续提升系统的鲁棒性与泛化能力。

3. 研发视觉Agent的协作机制，支持多智能体协同任务（如跨模态推理、工具调用），优化模型在实时性、资源效率及长上下文处理中的表现。

4. 研发大模型在业务场景下关键能力的应用研发，包括但不限于知识和指令遵循、分析诊断、深度推理、反思和评估等能力的优化和落地。

5. 结合业务场景设计并落地视觉Agent应用，赋能业务智能化升级。

6. 跟踪计算机视觉与大模型交叉领域的前沿技术，探索创新技术在实际场景中的落地路径。

📮 投递简历 ✨AI模拟面试

难度：

包括英文材料

学历+

OpenCV+

AI agent+

算法+

还有更多 •••

登录查看完整学习资料

相关职位

多模态世界模型算法专家-Top Seed

校招A143624

团队介绍：字节跳动 Seed 团队成立于 2023 年，致力于寻找通用智能的新方法，追求智能上限。团队研究方向涵盖 LLM、语音、视觉、世界模型、基础架构、AI Infra、下一代 AI 交互等，在中国、新加坡、美国等地设有实验室和岗位。 Seed 团队在 AI 领域拥有长期愿景与决心，坚持深耕基础，期望成为世界一流的 AI 研究团队，为科技和社会发展作出贡献。目前团队已推出业界领先的通用大模型以及前沿的多模态能力，支持豆包、扣子、即梦等超过 50 个应用场景。 1、探索研究多模态理解、生成式、机器学习、强化学习、AIGC、计算机视觉、人工智能等前沿技术； 2、探索大规模/超大规模多模态理解与生成交织的基础模型，并进行极致系统优化；数据建设、指令微调、偏好对齐、模型优化；提升数据合成、Scalable Oversight、模型推理、规划能力，构建全面客观准确的评测体系，探索提升大模型能力； 3、探索突破包括而不限于多模态RAG，视觉COT与Agent等在内的多模态模型、世界模型进阶能力，构建GUI/游戏等虚拟世界的通用多模态Agent； 4、利用预训练、仿真等技术对虚拟/现实世界的各类环境进行建模，提供多模态交互探索的基本能力，推动应用落地，研发以人工智能技术为核心的新技术、新产品。

更新于 2025-04-18杭州

多模态世界模型算法专家-Top Seed

校招A19732

更新于 2025-04-18上海

多模态世界模型算法专家-Top Seed

校招A202438A

更新于 2025-04-22深圳

多模态世界模型算法专家-Top Seed

校招A106538A

更新于 2025-04-18北京