智能互联高德-多模态大模型/端到端自动驾驶算法工程师/专家-视觉团队

社招全职3年以上技术类-算法2026-03-30地点：北京状态：招聘

扫码手机上打开

任职要求

1. 自然语言处理、计算机视觉、人工智能等相关专业的硕士生/博士生，对发文章有兴趣，具备良好的英文写作能力；
2. 发表过CV&AI顶会论文优先，ACM编程竞赛、数据建模竞赛等竞赛获奖优先。
3. 动手实现能力强，代码基本功扎实，精通基于Python的算法开发；熟练掌握pytorch/tensorflow/mxnet等至…

登录查看完整任职要求

微信扫码，1秒登录

工作职责

我们是谁？  
作为中国领先的数字地图内容及导航服务提供商，高德地图日均服务数亿用户出行决策，每日处理超百亿级位置数据。视觉技术中心是驱动高德实现厘米级高精地图、实时三维重建、多模态感知等核心技术的引擎，持续突破自动驾驶、AR导航、智慧交通等领域的技术边界。
团队gihub主页：https://github.com/amap-cvlab

为何加入我们？  
挑战世界级技术难题，追求智能上限 
用AI驱动国民级APP的产品迭代和颠覆式创新

岗位职责：
团队主要聚焦多模态大模型技术在端到端自动驾驶的应用，我们期待你的工作将覆盖以下至少一个技术方向即可： 
1. 在端到端自动驾驶、多模态大模型的训练及调优、BEV感知、基于深度学习/强化学习的规划控制、RLHF、驾驶场景视频生成等领域具备丰富且有独创性的研究经历。
2. 探索多模态大模型在下游任务中的技术能力，包括但不限于图文对齐/识别、跨模态理解生成、多模态检索、VLM端到端自动驾驶、世界模型等。
3. 了解大模型模型的训练/微调/推理加速方法，包括但不限于模型结构调优、训练效率提升、高效低成本微调、Muti-token推理，模型部署加速等。
4. 参与自动驾驶系统中机器学习算法的研究、开发与优化，包括但不限于深度学习算法在端到端感知大模型、规控大模型、视觉语言大模型等方面的应用。
5. 负责收集、整理和分析自动驾驶相关的数据集，进行数据预处理和标注，以提高模型的准确性和泛化能力。
6. 设计和实现端到端自动驾驶模型的训练流程，包括选择合适的优化算法、调整超参数、评估模型性能等，确保模型在不同场景下的稳定性和可靠性。

📮 投递简历 ✨AI模拟面试

难度：

包括英文材料

NLP+

OpenCV+

Python+

算法+

PyTorch+

还有更多 •••

登录查看完整学习资料

相关职位

高德-多模态大模型/端到端算法工程师/专家-车道级导航方向-视觉技术中心（急招）

社招1年以上技术类-算法

我们是谁？作为中国领先的数字地图内容及导航服务提供商，高德地图日均服务数亿用户出行决策，每日处理超百亿级位置数据。视觉技术中心是驱动高德实现厘米级高精地图、实时三维重建、多模态感知等核心技术的引擎，持续突破自动驾驶、AR导航、智慧交通等领域的技术边界。团队gihub主页：https://github.com/amap-cvlab 为何加入我们？挑战世界级技术难题，追求智能上限用AI驱动国民级APP的产品迭代和颠覆式创新岗位职责：团队主要聚焦多模态大模型及端到端模型在车端导航及定位应用，我们期待你的工作将覆盖以下至少一个技术方向即可： 1. 在端到端自动驾驶、BEV环境感知、多模态融合、强化学习等领域具备丰富且有独创性的研究经历； 2. 探索多模态大模型在下游任务中的技术能力，包括但不限于图文对齐/识别、跨模态理解生成、多模态检索、VLM端到端自动驾驶、世界模型等； 3. 了解大模型模型的训练/微调/推理加速方法，包括但不限于模型结构调优、训练效率提升、高效低成本微调、Muti-token推理，模型部署加速等； 4. 参与自动驾驶系统中机器学习算法的研究、开发与优化，包括但不限于深度学习算法在端到端感知大模型、规控大模型、视觉语言大模型等方面的应用； 5. 负责收集、整理和分析自动驾驶相关的数据集，进行数据预处理和标注，以提高模型的准确性和复杂场景泛化能力； 6. 设计和实现端到端自动驾驶模型的训练流程，包括选择合适的优化算法、调整超参数、评估模型性能等，确保模型在不同场景下的稳定性和可靠性。

更新于 2026-07-06北京

高德-多模态大模型算法-路线生成

实习高德研究型实习生

【团队介绍】高德地图驾车出行产品团队，专注于为数亿用户提供更智能、更顺畅的驾车导航体验。我们正处于 AI 与出行深度融合的关键阶段，用技术重新定义人与路的关系。加入我们，你将在真实的亿级用户产品中留下你的思考与设计。【岗位职责】参与驾车出行用户体验的需求调研与分析，包括问卷设计、用户访谈、数据解读；开展竞品分析与市场调研，持续追踪行业动态，输出有深度的竞品研究报告；协助探索 AI 能力在驾车场景中的产品化路径，参与 AI 功能的策略讨论与需求定义；独立完成产品原型设计，配合视觉与研发推动功能落地；跟踪产品迭代数据，协助评估版本效果，提出优化建议；对接跨职能团队，协助整理 PRD 文档与项目推进。

更新于 2026-03-16北京

高德-多模态大模型算法工程师/专家-图片理解/模型训练方向

社招3年以上技术类-算法

职位名称：团队介绍：作为中国领先的数字地图内容及导航服务提供商，高德地图日均服务数亿用户出行决策，每日处理超百亿级位置数据。视觉技术中心是驱动高德实现空间智能、高精度地图、三维重建、LLM/VLM，AI Agent等核心技术，持续突破自动驾驶、AR导航、具身智能、推广搜和生活服务等领域的技术边界。团队不仅在计算机视觉领域持续深耕，更将计算机视觉及AI技术在自主导航、高德打车、生活服务等多元化应用场景。作为高德地图的核心技术驱动部门，我们以下一代三维地图引擎、多模态理解与生成、空间智能、世界模型等方向为核心，推动智能出行与真实世界连接的深度融合。团队gihub主页：https://github.com/amap-cvlab 为何加入我们？ 1. 定义未来地图范式：不再局限于传统视觉感知，而是利用多模态大模型实现从“看到”到“理解并生成”的跨越，解决行业核心痛点 2. 直面海量数据与复杂场景：处理中国乃至全球最复杂、最丰富的驾驶场景数据，构建坚实的技术壁垒 3. 完整的研发生态：从顶级学术研究（顶会论文）、开源项目（见团队GitHub）到国民级应用落地，提供全方位的价值实现舞台岗位职责： 1. 核心方向：研发面向车道级地图自动化构建的多模态大模型，基于道路图像自动提取车道线、POI信息等地图要素，实现高效、自动化的地图数据生产； 2. 模型全链路研发：负责或参与多模态大模型的预训练、有监督微调（SFT）、奖励模型（RM）训练与强化学习（RL）优化全流程，探索模型在空间推理、结构化生成任务上的能力强化路径； 3. 技术攻坚与落地：优化模型的推理效率、泛化能力与输出稳定性，研究适配的模型压缩（量化、蒸馏）、加速技术与部署方案，推动技术在大规模数据生产管线中落地； 4. 前沿探索与创新：跟踪并吸收多模态理解、视觉生成、世界模型、3DGS等领域的前沿进展，将其创新性地应用于地图生成问题，持续提升自动化生产的质量与范围。

更新于 2026-03-30北京

高德-多模态大模型算法工程师-空间智能方向-视觉技术中心

社招3年以上技术类-算法

团队介绍：作为中国领先的数字地图内容及导航服务提供商，高德地图日均服务数亿用户出行决策，每日处理超百亿级位置数据。视觉技术中心是驱动高德实现高精度地图、三维重建、LLM/VLM，AI Agent等核心技术，持续突破自动驾驶、AR导航、具身智能、推广搜和生活服务等领域的技术边界。团队不仅在计算机视觉领域持续深耕，更将计算机视觉及AI技术在自主导航、高德打车、生活服务等多元化应用场景。作为高德地图的核心技术驱动部门，我们以下一代三维地图引擎、多模态理解与生成、空间智能、世界模型等方向为核心，推动智能出行与真实世界连接的深度融合。团队gihub主页： https://github.com/amap-cvlab 为何加入我们？ 1. 挑战业界顶尖难题：处理百亿级位置数据，攻克动态世界中海量POI的实时、精准感知与理解，定义未来地图的“AI之眼”。 2. 驱动国民级应用创新：你的技术将直接应用于高德地图数亿用户依赖的扫街榜等核心功能，实现从技术突破到产品颠覆的全流程落地。 3. 置身前沿技术浪潮：在三维地图、世界模型、具身智能等前沿领域进行深度探索与研发。 4. 预研与业务深度结合：在这里，你将同时接触到面向未来的技术预研和支撑亿级用户的业务算法。我们提供从0到1的创新探索环境，也看重从1到N的规模化落地能力。职位描述：我们正在寻找一位专注多模态视觉理解的算法工程师。您将主要负责利用多模态大模型技术，从海量街景图片与视频中自动发现、识别与更新地图POI信息，提升地图数据的鲜度、广度与精度，为用户提供更智能、更沉浸的出行与生活服务。本岗位兼具前瞻性技术探索与规模化业务落地的双重属性，你将有机会完整参与从创新模型研究到核心业务系统迭代的全过程。主要职责： 1. 前瞻性模型预研与业务驱动研发：探索并研发适用于大规模街景图像/视频理解的下一代视觉-语言大模型（VLM），重点攻克POI变化发现、细粒度属性理解等关键课题，并将创新技术转化为实际业务解决方案。 2. 端到端业务落地与闭环优化：主导多模态POI发现技术在“高德扫街榜”等核心业务中的集成、优化与全流程落地。 3. 前沿技术跟踪与创新：持续跟踪多模态理解、视频表征学习、地理空间智能等领域的最新进展，探索技术边界发表高质量论文，实现空间感知理解的学术突破，持续迭代核心算法，达到业界sota。

更新于 2025-12-31北京