智能互联高德-多模态大模型算法工程师/专家-图片理解/模型训练方向

社招全职3年以上技术类-算法2026-03-30地点：北京状态：招聘

扫码手机上打开

任职要求

基本条件：
1.  计算机科学、人工智能、机器学习等相关专业硕士及以上学历，3年以上算法研发经验；
2.  坚实的多模态大模型基础：深入理解CLIP、BLIP、LLaVA、Qwen-VL等模型的原理，并有相关实践，如有对图片、视频的理解、生成或编辑能力更加分；
3.  强烈的自驱力与好奇心：对探索AI技术边界充满热情，能主动追踪前沿并快速实验验证，具备优秀的学习能力和韧性。

优先条件：
1.  在多模态理解与生成、视觉-语言…

登录查看完整任职要求

微信扫码，1秒登录

工作职责

职位名称：

团队介绍：
作为中国领先的数字地图内容及导航服务提供商，高德地图日均服务数亿用户出行决策，每日处理超百亿级位置数据。视觉技术中心是驱动高德实现空间智能、高精度地图、三维重建、LLM/VLM，AI Agent等核心技术，持续突破自动驾驶、AR导航、具身智能、推广搜和生活服务等领域的技术边界。团队不仅在计算机视觉领域持续深耕，更将计算机视觉及AI技术在自主导航、高德打车、生活服务等多元化应用场景。 作为高德地图的核心技术驱动部门，我们以下一代三维地图引擎、多模态理解与生成、空间智能、世界模型等方向为核心，推动智能出行与真实世界连接的深度融合。
团队gihub主页：https://github.com/amap-cvlab

为何加入我们？
1.  定义未来地图范式：不再局限于传统视觉感知，而是利用多模态大模型实现从“看到”到“理解并生成”的跨越，解决行业核心痛点
2.  直面海量数据与复杂场景：处理中国乃至全球最复杂、最丰富的驾驶场景数据，构建坚实的技术壁垒
3.  完整的研发生态：从顶级学术研究（顶会论文）、开源项目（见团队GitHub）到国民级应用落地，提供全方位的价值实现舞台

岗位职责：
1.  核心方向：研发面向车道级地图自动化构建的多模态大模型，基于道路图像自动提取车道线、POI信息等地图要素，实现高效、自动化的地图数据生产；
2.  模型全链路研发：负责或参与多模态大模型的预训练、有监督微调（SFT）、奖励模型（RM）训练与强化学习（RL）优化全流程，探索模型在空间推理、结构化生成任务上的能力强化路径；
3.  技术攻坚与落地：优化模型的推理效率、泛化能力与输出稳定性，研究适配的模型压缩（量化、蒸馏）、加速技术与部署方案，推动技术在大规模数据生产管线中落地；
4.  前沿探索与创新：跟踪并吸收多模态理解、视觉生成、世界模型、3DGS等领域的前沿进展，将其创新性地应用于地图生成问题，持续提升自动化生产的质量与范围。

📮 投递简历 ✨AI模拟面试

难度：

包括英文材料

机器学习+

学历+

算法+

大模型+

自动驾驶+

CVPR+

还有更多 •••

登录查看完整学习资料

相关职位

高德-多模态大模型算法工程师/专家-图片理解/模型训练方向

社招3年以上技术类-算法

职位名称：团队介绍：作为中国领先的数字地图内容及导航服务提供商，高德地图日均服务数亿用户出行决策，每日处理超百亿级位置数据。视觉技术中心是驱动高德实现空间智能、高精度地图、三维重建、LLM/VLM，AI Agent等核心技术，持续突破自动驾驶、AR导航、具身智能、推广搜和生活服务等领域的技术边界。团队不仅在计算机视觉领域持续深耕，更将计算机视觉及AI技术在自主导航、高德打车、生活服务等多元化应用场景。作为高德地图的核心技术驱动部门，我们以下一代三维地图引擎、多模态理解与生成、空间智能、世界模型等方向为核心，推动智能出行与真实世界连接的深度融合。团队gihub主页：https://github.com/amap-cvlab 为何加入我们？ 1. 定义未来地图范式：不再局限于传统视觉感知，而是利用多模态大模型实现从“看到”到“理解并生成”的跨越，解决行业核心痛点 2. 直面海量数据与复杂场景：处理中国乃至全球最复杂、最丰富的驾驶场景数据，构建坚实的技术壁垒 3. 完整的研发生态：从顶级学术研究（顶会论文）、开源项目（见团队GitHub）到国民级应用落地，提供全方位的价值实现舞台岗位职责： 1. 核心方向：研发面向车道级地图自动化构建的多模态大模型，基于道路图像自动提取车道线、POI信息等地图要素，实现高效、自动化的地图数据生产； 2. 模型全链路研发：负责或参与多模态大模型的预训练、有监督微调（SFT）、奖励模型（RM）训练与强化学习（RL）优化全流程，探索模型在空间推理、结构化生成任务上的能力强化路径； 3. 技术攻坚与落地：优化模型的推理效率、泛化能力与输出稳定性，研究适配的模型压缩（量化、蒸馏）、加速技术与部署方案，推动技术在大规模数据生产管线中落地； 4. 前沿探索与创新：跟踪并吸收多模态理解、视觉生成、世界模型、3DGS等领域的前沿进展，将其创新性地应用于地图生成问题，持续提升自动化生产的质量与范围。

更新于 2026-03-30北京

高德-多模态大模型/端到端算法工程师/专家-车道级导航方向-视觉技术中心（急招）

社招1年以上技术类-算法

我们是谁？作为中国领先的数字地图内容及导航服务提供商，高德地图日均服务数亿用户出行决策，每日处理超百亿级位置数据。视觉技术中心是驱动高德实现厘米级高精地图、实时三维重建、多模态感知等核心技术的引擎，持续突破自动驾驶、AR导航、智慧交通等领域的技术边界。团队gihub主页：https://github.com/amap-cvlab 为何加入我们？挑战世界级技术难题，追求智能上限用AI驱动国民级APP的产品迭代和颠覆式创新岗位职责：团队主要聚焦多模态大模型及端到端模型在车端导航及定位应用，我们期待你的工作将覆盖以下至少一个技术方向即可： 1. 在端到端自动驾驶、BEV环境感知、多模态融合、强化学习等领域具备丰富且有独创性的研究经历； 2. 探索多模态大模型在下游任务中的技术能力，包括但不限于图文对齐/识别、跨模态理解生成、多模态检索、VLM端到端自动驾驶、世界模型等； 3. 了解大模型模型的训练/微调/推理加速方法，包括但不限于模型结构调优、训练效率提升、高效低成本微调、Muti-token推理，模型部署加速等； 4. 参与自动驾驶系统中机器学习算法的研究、开发与优化，包括但不限于深度学习算法在端到端感知大模型、规控大模型、视觉语言大模型等方面的应用； 5. 负责收集、整理和分析自动驾驶相关的数据集，进行数据预处理和标注，以提高模型的准确性和复杂场景泛化能力； 6. 设计和实现端到端自动驾驶模型的训练流程，包括选择合适的优化算法、调整超参数、评估模型性能等，确保模型在不同场景下的稳定性和可靠性。

更新于 2026-07-20北京

高德-多模态大模型/端到端自动驾驶算法工程师/专家-视觉团队

社招3年以上技术类-算法

我们是谁？作为中国领先的数字地图内容及导航服务提供商，高德地图日均服务数亿用户出行决策，每日处理超百亿级位置数据。视觉技术中心是驱动高德实现厘米级高精地图、实时三维重建、多模态感知等核心技术的引擎，持续突破自动驾驶、AR导航、智慧交通等领域的技术边界。团队gihub主页：https://github.com/amap-cvlab 为何加入我们？挑战世界级技术难题，追求智能上限用AI驱动国民级APP的产品迭代和颠覆式创新岗位职责：团队主要聚焦多模态大模型技术在端到端自动驾驶的应用，我们期待你的工作将覆盖以下至少一个技术方向即可： 1. 在端到端自动驾驶、多模态大模型的训练及调优、BEV感知、基于深度学习/强化学习的规划控制、RLHF、驾驶场景视频生成等领域具备丰富且有独创性的研究经历。 2. 探索多模态大模型在下游任务中的技术能力，包括但不限于图文对齐/识别、跨模态理解生成、多模态检索、VLM端到端自动驾驶、世界模型等。 3. 了解大模型模型的训练/微调/推理加速方法，包括但不限于模型结构调优、训练效率提升、高效低成本微调、Muti-token推理，模型部署加速等。 4. 参与自动驾驶系统中机器学习算法的研究、开发与优化，包括但不限于深度学习算法在端到端感知大模型、规控大模型、视觉语言大模型等方面的应用。 5. 负责收集、整理和分析自动驾驶相关的数据集，进行数据预处理和标注，以提高模型的准确性和泛化能力。 6. 设计和实现端到端自动驾驶模型的训练流程，包括选择合适的优化算法、调整超参数、评估模型性能等，确保模型在不同场景下的稳定性和可靠性。

更新于 2026-03-30北京

高德-多模态大模型算法工程师-空间智能方向-视觉技术中心

社招3年以上技术类-算法

团队介绍：作为中国领先的数字地图内容及导航服务提供商，高德地图日均服务数亿用户出行决策，每日处理超百亿级位置数据。视觉技术中心是驱动高德实现高精度地图、三维重建、LLM/VLM，AI Agent等核心技术，持续突破自动驾驶、AR导航、具身智能、推广搜和生活服务等领域的技术边界。团队不仅在计算机视觉领域持续深耕，更将计算机视觉及AI技术在自主导航、高德打车、生活服务等多元化应用场景。作为高德地图的核心技术驱动部门，我们以下一代三维地图引擎、多模态理解与生成、空间智能、世界模型等方向为核心，推动智能出行与真实世界连接的深度融合。团队gihub主页： https://github.com/amap-cvlab 为何加入我们？ 1. 挑战业界顶尖难题：处理百亿级位置数据，攻克动态世界中海量POI的实时、精准感知与理解，定义未来地图的“AI之眼”。 2. 驱动国民级应用创新：你的技术将直接应用于高德地图数亿用户依赖的扫街榜等核心功能，实现从技术突破到产品颠覆的全流程落地。 3. 置身前沿技术浪潮：在三维地图、世界模型、具身智能等前沿领域进行深度探索与研发。 4. 预研与业务深度结合：在这里，你将同时接触到面向未来的技术预研和支撑亿级用户的业务算法。我们提供从0到1的创新探索环境，也看重从1到N的规模化落地能力。职位描述：我们正在寻找一位专注多模态视觉理解的算法工程师。您将主要负责利用多模态大模型技术，从海量街景图片与视频中自动发现、识别与更新地图POI信息，提升地图数据的鲜度、广度与精度，为用户提供更智能、更沉浸的出行与生活服务。本岗位兼具前瞻性技术探索与规模化业务落地的双重属性，你将有机会完整参与从创新模型研究到核心业务系统迭代的全过程。主要职责： 1. 前瞻性模型预研与业务驱动研发：探索并研发适用于大规模街景图像/视频理解的下一代视觉-语言大模型（VLM），重点攻克POI变化发现、细粒度属性理解等关键课题，并将创新技术转化为实际业务解决方案。 2. 端到端业务落地与闭环优化：主导多模态POI发现技术在“高德扫街榜”等核心业务中的集成、优化与全流程落地。 3. 前沿技术跟踪与创新：持续跟踪多模态理解、视频表征学习、地理空间智能等领域的最新进展，探索技术边界发表高质量论文，实现空间感知理解的学术突破，持续迭代核心算法，达到业界sota。

更新于 2025-12-31北京