高德地图高德-多模态内容理解算法工程师/专家-视觉技术中心

社招全职3年以上技术类-算法2025-09-23地点：北京状态：招聘

扫码手机上打开

任职要求

计算机、电子信息、数学等相关专业，硕士及以上学历
在计算机视觉、多模态理解方面有扎实的研究基础，熟悉主流模型和算法，如CLIP，BLIP，LLaVA，Qwen-VL，video-llama等，有实际项目落地经验者优先；
熟悉深度学习框架，如Tenso…

登录查看完整任职要求

微信扫码，1秒登录

工作职责

负责图像、视频内容理解相关的大模型研发工作，包括但不限于视觉描述生成（Video Caption）、视觉问答（VQA）、多模态大模型（MLLM）等技术，通过内容理解相关算法在业务中的探索与应用，解决实际业务问题；

📮 投递简历 ✨AI模拟面试

难度：

包括英文材料

学历+

OpenCV+

算法+

Llama+

深度学习+

TensorFlow+

C+++

还有更多 •••

登录查看完整学习资料

相关职位

（大模型专项）多模态内容理解算法工程师/专家 -【北京/杭州】

社招D13918

1、负责快手多媒体内容理解工作，应用计算机视觉、NLP、多模态融合等技术，提升短视频/直播内容体系建设、推荐、搜索的效果和体验； 2、负责快手多媒体相关的内容理解、语义理解的相关算法的研发，包括但不限于视频多分类、视频多标签、视频多模态embedding学习； 3、负责计算机多模态方向前沿问题的研究，参与建设并持续保持部门在多模态业界的技术先进性，保持创新的同时将业界SOTA模型持续优化并落地至线上获得收益。

更新于 2025-05-19北京

多模态内容理解算法工程师/专家

社招5-10年J0011

1、负责快手短视频多模态内容理解工作，应用计算机视觉、NLP、多模态融合等技术，提升短视频内容体系建设、推荐、搜索的效果和体验； 2、基于多模态模型在下游业务上的应用，包括并不限于多模态分类、标签、caption等文本生成等； 3、负责计算机多模态理解方向前沿问题的研究，参与建设并持续保持部门在多模态业界的技术先进性，保持创新的同时将业界SOTA模型持续优化并落地至线上获得收益。

更新于 2026-03-04北京

高德-多模态大模型算法工程师/专家-内容理解和AIGC生成方向

社招2年以上技术类-算法

团队介绍：高德地图机器学习研发部是公司AI核心技术引擎，聚焦多模态大模型、视频生成与理解、图像编辑与生成等前沿领域。团队深耕人工智能技术落地，支撑亿级用户产品，同时长期投入前沿探索，在NeurIPS/ICLR/CVPR/ACL等顶会发表多篇论文，多项成果入选“最有影响力论文”榜单。我们拥有海量数据与算力资源，鼓励创新突破，诚邀你与顶尖算法专家并肩，共同定义AI的未来！如果你渴望挑战多模态与生成式AI的技术巅峰，在视频、图像、大模型的交叉领域实现突破，欢迎加入我们！团队的github页面是：https://github.com/AMAP-ML/ 我们提供 • 参与亿级用户产品的AI核心算法研发，见证技术直接赋能业务； • 与学术大牛和工业界专家共事，持续提升技术视野； • 顶配算力资源+开放创新氛围，支持前沿探索与顶会论文发表。具体职责包含但不限于： 1. 视觉理解任务的技术探索，要求对视觉基础任务有深入的理解，做好在商品理解、详情页的文图内容、开放图片识别等公司核心业务上的落地； 2. 多模态大模型的技术探索，要求对多模态大模型训练、文图跨模态对齐等有深入实践，做好多模态大模型的能力构建和应用； 3. 追踪领域前沿工作，沉淀技术，投稿领域顶级会议。

更新于 2025-11-03北京

高德-资深多模态大模型算法专家-视觉技术中心

社招5年以上技术类-算法

团队介绍：作为中国领先的数字地图内容及导航服务提供商，高德地图日均服务数亿用户出行决策，每日处理超百亿级位置数据。视觉技术中心是驱动高德实现高精度地图、三维重建、LLM/VLM，AI Agent等核心技术，持续突破自动驾驶、AR导航、具身智能、推广搜和生活服务等领域的技术边界。团队不仅在计算机视觉领域持续深耕，更将计算机视觉及AI技术在自主导航、高德打车、生活服务等多元化应用场景。作为高德地图的核心技术驱动部门，我们以下一代三维地图引擎、多模态理解与生成、空间智能、世界模型等方向为核心，推动智能出行与真实世界连接的深度融合。团队gihub主页：https://github.com/amap-cvlab 为何加入我们？挑战世界级技术难题，追求智能上限用AI驱动国民级APP的产品迭代和颠覆式创新我们正在寻找对多模态技术充满热情的算法工程师，加入我们的研发团队。您将专注于多模态理解与生成，推动其在高德扫街榜等热门应用中落地，为用户提供更智能、更沉浸的服务。主要职责： 1、多模态大模型研发：开发业界领先的图文多模态大模型，实现高质量场景理解和内容生成； 2、模型优化与性能提升：优化多模态模型的推理速度和计算效率，支持端侧部署。探索适合大模型的压缩与加速技术（包括但不限于量化、剪枝、知识蒸馏等）； 3、业务场景落地：将多模态技术应用于扫街榜等实际业务场景，与产品、工程团队合作，推动技术从研发到上线的全流程落地； 4、前沿技术探索：持续跟踪生成式AI、跨模态对齐、思维链、强化学习、多模态交互等最新技术趋势，提出创新性解决方案。

更新于 2026-02-03北京