高德地图高德-资深多模态大模型算法专家-视觉技术中心

社招全职5年以上技术类-算法2026-02-03地点：北京状态：招聘

扫码手机上打开

任职要求

1、5年及以上工作经历，计算机科学、人工智能等相关专业硕士及以上学历；
2、熟悉多模态领域的重要算法和模型（如Qwen-VL、CLIP、Stable Diffusion等），掌握LoRA、SFT、RL等训练方法，有实际项目经验者优先；
3、熟练使用pytorch/deeps…

登录查看完整任职要求

微信扫码，1秒登录

工作职责

团队介绍：
作为中国领先的数字地图内容及导航服务提供商，高德地图日均服务数亿用户出行决策，每日处理超百亿级位置数据。视觉技术中心是驱动高德实现高精度地图、三维重建、LLM/VLM，AI Agent等核心技术，持续突破自动驾驶、AR导航、具身智能、推广搜和生活服务等领域的技术边界。团队不仅在计算机视觉领域持续深耕，更将计算机视觉及AI技术在自主导航、高德打车、生活服务等多元化应用场景。 作为高德地图的核心技术驱动部门，我们以下一代三维地图引擎、多模态理解与生成、空间智能、世界模型等方向为核心，推动智能出行与真实世界连接的深度融合。
团队gihub主页：https://github.com/amap-cvlab

为何加入我们？
挑战世界级技术难题，追求智能上限
用AI驱动国民级APP的产品迭代和颠覆式创新

我们正在寻找对多模态技术充满热情的算法工程师，加入我们的研发团队。您将专注于多模态理解与生成，推动其在高德扫街榜等热门应用中落地，为用户提供更智能、更沉浸的服务。

主要职责：
1、多模态大模型研发：开发业界领先的图文多模态大模型，实现高质量场景理解和内容生成；
2、模型优化与性能提升：优化多模态模型的推理速度和计算效率，支持端侧部署。探索适合大模型的压缩与加速技术（包括但不限于量化、剪枝、知识蒸馏等）；
3、业务场景落地：将多模态技术应用于扫街榜等实际业务场景，与产品、工程团队合作，推动技术从研发到上线的全流程落地；
4、前沿技术探索：持续跟踪生成式AI、跨模态对齐、思维链、强化学习、多模态交互等最新技术趋势，提出创新性解决方案。

📮 投递简历 ✨AI模拟面试

难度：

包括英文材料

学历+

算法+

PyTorch+

Python+

C+++

CVPR+

还有更多 •••

登录查看完整学习资料

相关职位

高德-资深多模态大模型/端到端自动驾驶算法专家-视觉团队

社招4年以上技术类-算法

我们是谁？作为中国领先的数字地图内容及导航服务提供商，高德地图日均服务数亿用户出行决策，每日处理超百亿级位置数据。视觉技术中心是驱动高德实现厘米级高精地图、实时三维重建、多模态感知等核心技术的引擎，持续突破自动驾驶、AR导航、智慧交通等领域的技术边界。团队gihub主页：https://github.com/amap-cvlab 为何加入我们？挑战世界级技术难题，追求智能上限用AI驱动国民级APP的产品迭代和颠覆式创新岗位职责：团队主要聚焦多模态大模型技术在端到端自动驾驶的应用，我们期待你的工作将覆盖以下至少一个技术方向即可： 1. 在端到端自动驾驶、多模态大模型的训练及调优、BEV感知、基于深度学习/强化学习的规划控制、RLHF、驾驶场景视频生成等领域具备丰富且有独创性的研究经历。 2. 探索多模态大模型在下游任务中的技术能力，包括但不限于图文对齐/识别、跨模态理解生成、多模态检索、VLM端到端自动驾驶、世界模型等。 3. 了解大模型模型的训练/微调/推理加速方法，包括但不限于模型结构调优、训练效率提升、高效低成本微调、Muti-token推理，模型部署加速等。 4. 参与自动驾驶系统中机器学习算法的研究、开发与优化，包括但不限于深度学习算法在端到端感知大模型、规控大模型、视觉语言大模型等方面的应用。 5. 负责收集、整理和分析自动驾驶相关的数据集，进行数据预处理和标注，以提高模型的准确性和泛化能力。 6. 设计和实现端到端自动驾驶模型的训练流程，包括选择合适的优化算法、调整超参数、评估模型性能等，确保模型在不同场景下的稳定性和可靠性。

更新于 2025-12-24北京

高德-资深3D重建/生成算法专家-视觉团队

社招4年以上技术类-算法

我们是谁？作为中国领先的数字地图内容及导航服务提供商，高德地图日均服务数亿用户出行决策，每日处理超百亿级位置数据。视觉技术中心是驱动高德实现厘米级高精地图、实时三维重建、多模态感知等核心技术的引擎，持续突破自动驾驶、AR导航、智慧交通等领域的技术边界。团队gihub主页：https://github.com/amap-cvlab 为何加入我们？挑战世界级技术难题，追求智能上限用AI驱动国民级APP的产品迭代和颠覆式创新岗位职责： 1、负责研发空间智能核心技术，进行室内/室外/航拍/卫片等全场景高质量空间理解、重建与生成，包括但不限于基于图像、视频、点云、Mesh和3DGS等多种模态数据的空间智能基座与应用； 2、负责多模态大模型和视频生成大模型的预训练、微调等工作，包括但不限于数字人、生成式重建及空间生成等应用方向； 3、负责大规模多模态数据集的构建、清洗与管理，搭建高效数据流水线，保障算法训练与评估； 4、负责结合具体需求，抽象出关键算法进行研发，并持续保持及引领相关技术指标。

更新于 2025-11-14北京

高德-资深VLA/空间计算/强化学习算法专家-视觉团队

社招3年以上技术类-算法

我们正在寻找在具身智能VLA（视觉-语言-动作）、空间计算（重建、SLAM等）及强化学习领域有深厚积累的算法同学，加入高德地图视觉技术中心。你将参与构建下一代地图中的感知、理解与决策系统，推动具身导航、AR/VR、场景建模等前沿技术的研发与落地。如果你热衷于用AI改变人们出行方式，渴望在真实世界大规模数据上验证算法能力，欢迎加入我们！岗位职责： ● 负责视觉语言动作（VLA）的具身智能模型和视觉语言模型（VLM）的研发，提升具身agent的空间理解和行动决策能力； ● 推进空间计算相关技术（如SLAM、三维重建、点云处理、姿态估计等）在下一代地图、虚拟现实等场景的应用； ● 探索强化学习在多模态大模型的后训练中的应用，提升具身/空间智能的能力天花板； ● 跟踪国际前沿技术发展，持续推动技术创新，并落实到实际应用中； ● 与工程团队紧密协作，完成从算法研发到系统部署的全流程闭环。

更新于 2025-11-13北京

高德-资深生成式大模型算法专家-北京（急招）-视觉技术中心

社招3年以上技术类-算法

1、负责基于扩散模型的世界生成、视频生成等相关场景的算法研发工作，结合实际应用场景攻克技术难题，包括世界生成过程中的可控性、时空一致性、实时性等问题； 2、参与并主导生成式大模型核心算法研发，包括 Diffusion、Autoregressive（AR）、VAE、Transformer 等架构。研发时空视频编码、压缩与生成算法，优化模型在生成任务中的一致性与时序表现。设计并实现从预训练到后训练（SFT、RLHF）的全流程模型优化方案，提升生成质量、可控性和效率； 3、负责生成式大模型的总体技术架构设计，探索多模态融合、跨任务迁移等创新方向，跟踪前沿研究进展，进行技术评估与落地转化，推动团队在行业/学术上的技术领先。

更新于 2026-01-23北京