高德地图高德-多模态大模型算法工程师-空间智能方向-视觉技术中心

社招全职3年以上技术类-算法2025-12-31地点：北京状态：招聘

扫码手机上打开

任职要求

1. 基础要求： 计算机科学、人工智能、遥感等相关专业硕士及以上学历，具备3年及以上计算机视觉或多模态算法研发经验。
2. 核心技术能力：
   · 精通多模态理解的主流模型与方法（如Qwen-VL、BLIP、Grounding DINO等）。
   · 具有丰富的图像/视频理解项目经验，熟悉时序建模、弱监督学习等相关技术者更佳。
   · 熟练掌握PyTorch、DeepSpeed、Transformers等主流框架，具备扎实的Python/C++编程和模型调试能力。
3. 方法论经验…

登录查看完整任职要求

微信扫码，1秒登录

工作职责

团队介绍：
作为中国领先的数字地图内容及导航服务提供商，高德地图日均服务数亿用户出行决策，每日处理超百亿级位置数据。视觉技术中心是驱动高德实现高精度地图、三维重建、LLM/VLM，AI Agent等核心技术，持续突破自动驾驶、AR导航、具身智能、推广搜和生活服务等领域的技术边界。团队不仅在计算机视觉领域持续深耕，更将计算机视觉及AI技术在自主导航、高德打车、生活服务等多元化应用场景。 作为高德地图的核心技术驱动部门，我们以下一代三维地图引擎、多模态理解与生成、空间智能、世界模型等方向为核心，推动智能出行与真实世界连接的深度融合。
团队gihub主页： https://github.com/amap-cvlab

为何加入我们？
1. 挑战业界顶尖难题： 处理百亿级位置数据，攻克动态世界中海量POI的实时、精准感知与理解，定义未来地图的“AI之眼”。
2. 驱动国民级应用创新： 你的技术将直接应用于高德地图数亿用户依赖的扫街榜等核心功能，实现从技术突破到产品颠覆的全流程落地。
3. 置身前沿技术浪潮： 在三维地图、世界模型、具身智能等前沿领域进行深度探索与研发。
4. 预研与业务深度结合：在这里，你将同时接触到面向未来的技术预研和支撑亿级用户的业务算法。我们提供从0到1的创新探索环境，也看重从1到N的规模化落地能力。

职位描述：
我们正在寻找一位专注多模态视觉理解的算法工程师。您将主要负责利用多模态大模型技术，从海量街景图片与视频中自动发现、识别与更新地图POI信息，提升地图数据的鲜度、广度与精度，为用户提供更智能、更沉浸的出行与生活服务。本岗位兼具前瞻性技术探索与规模化业务落地的双重属性，你将有机会完整参与从创新模型研究到核心业务系统迭代的全过程。

主要职责：
1. 前瞻性模型预研与业务驱动研发：探索并研发适用于大规模街景图像/视频理解的下一代视觉-语言大模型（VLM），重点攻克POI变化发现、细粒度属性理解等关键课题，并将创新技术转化为实际业务解决方案。
2. 端到端业务落地与闭环优化： 主导多模态POI发现技术在“高德扫街榜”等核心业务中的集成、优化与全流程落地。
3. 前沿技术跟踪与创新： 持续跟踪多模态理解、视频表征学习、地理空间智能等领域的最新进展，探索技术边界发表高质量论文，实现空间感知理解的学术突破，持续迭代核心算法，达到业界sota。

📮 投递简历 ✨AI模拟面试

难度：

包括英文材料

学历+

OpenCV+

算法+

PyTorch+

Python+

C+++

大模型+

还有更多 •••

登录查看完整学习资料

相关职位

多模态大模型算法工程师

社招算法序列

【工作职责】 1.负责面向自动驾驶极端场景下多模态大模型系统的算法研发与优化 2.负责面向自动驾驶图像质量评估相关算法的研发与优化 3.深度参与数据闭环、模型训练和部署、场景泛化性提升

更新于 2026-06-29北京|上海

多模态大模型算法工程师

社招3年以上计算机网络技术类

1、负责视觉-语言大模型(VLM)研发与优化，推动中医智能诊疗、医学图像分析等场景的端到端算法落地。 2、针对舌象、面色、关节等多类医学图像，开发分类、检测、分割及异常检测算法，支撑辅助诊断与健康评估。 3、设计跨模态融合架构，实现图像、文本等多源数据的协同建模与联合推理。 4、基于LLM/VLM进行SFT、RLHF、LoRA等微调，优化辨证论治、报告生成、医学问答等任务，提升临床实用性。 5、开发具备自主推理与工具调用能力的Agentic智能体，覆盖辅助诊断、用药监测、随访管理等自动化场景。 6、构建医学知识图谱，结合RAG技术增强模型可解释性与专业可信度。 7、跟踪前沿技术，探索创新应用，确保算法符合医疗伦理与监管要求。

更新于 2026-07-13深圳

多模态大模型算法工程师

社招5年以上CAI中台技术

1.负责多模态大模型（如图文理解、图文结合生成）的核心算法研究、设计与实现，包括但不限于模型结构创新、对齐技术、指令微调等，提升模型在线上业务的表现； 2.研究文生图、文生视频的强化学习后训练方法，提升图文一致性和生成稳定性； 3.紧密跟踪国内外多模态AI、大模型领域的最新研究进展，探索原生多模态生图和编辑模型设计和训练； 4.设计、实现并优化大规模多模态数据的预处理、清洗、标注、特征提取及高效融合方法； 5.参与团队内部的技术分享、专利申请、论文发表等工作，提升团队整体技术水平。

更新于 2025-09-24深圳

多模态大模型算法工程师

社招3年以上算法类

无

更新于 2025-12-09北京