高德地图高德-多模态大模型应用算法工程师-视觉技术团队

社招全职3年以上技术类-算法2025-12-11地点：北京状态：招聘

扫码手机上打开

任职要求

1、3年及以上工作经历，计算机科学、人工智能等相关专业硕士及以上学历；
2、熟悉多模态领域的重要算法和模型（如Qwen-VL、CLIP、Stable Diffusion等），掌握LoRA、SFT、RL等训练方法，有实际项目经验者优先；
3、熟练使用pytorch/deeps…

登录查看完整任职要求

微信扫码，1秒登录

工作职责

团队介绍：
作为中国领先的数字地图内容及导航服务提供商，高德地图日均服务数亿用户出行决策，每日处理超百亿级位置数据。视觉技术中心是驱动高德实现高精度地图、三维重建、LLM/VLM，AI Agent等核心技术，持续突破自动驾驶、AR导航、具身智能、推广搜和生活服务等领域的技术边界。团队不仅在计算机视觉领域持续深耕，更将计算机视觉及AI技术在自主导航、高德打车、生活服务等多元化应用场景。 作为高德地图的核心技术驱动部门，我们以下一代三维地图引擎、多模态理解与生成、空间智能、世界模型等方向为核心，推动智能出行与真实世界连接的深度融合。
团队gihub主页：https://github.com/amap-cvlab

为何加入我们？
挑战世界级技术难题，追求智能上限
用AI驱动国民级APP的产品迭代和颠覆式创新

我们正在寻找对多模态技术充满热情的算法工程师，加入我们的研发团队。您将专注于多模态理解与生成，推动其在高德扫街榜等热门应用中落地，为用户提供更智能、更沉浸的服务。
主要职责：
1、多模态大模型研发：开发业界领先的图文多模态大模型，实现高质量场景理解和内容生成；
2、模型优化与性能提升：优化多模态模型的推理速度和计算效率，支持端侧部署。探索适合大模型的压缩与加速技术（包括但不限于量化、剪枝、知识蒸馏等）；
3、业务场景落地：将多模态技术应用于扫街榜等实际业务场景，与产品、工程团队合作，推动技术从研发到上线的全流程落地；
4、前沿技术探索：持续跟踪生成式AI、跨模态对齐、思维链、强化学习、多模态交互等最新技术趋势，提出创新性解决方案。

📮 投递简历 ✨AI模拟面试

难度：

包括英文材料

学历+

算法+

PyTorch+

Python+

C+++

CVPR+

还有更多 •••

登录查看完整学习资料

相关职位

高德-多模态大模型算法工程师-视觉团队

社招3年以上技术类-算法

我们正在寻找对多模态技术充满热情的算法工程师，加入我们的前沿技术研发团队。您将专注于多模态理解与生成，推动其在地图数据、信息流推荐、打车服务等场景中的落地应用，为用户提供更智能、更沉浸的服务。主要职责 1、多模态模型研发：开发业界领先的图文多模态理解与生成模型，结合扩散模型（Diffusion Models）、Transformer架构等实现高质量场景理解和动态内容生成。 2、模型优化与性能提升：优化多模态模型的推理速度和计算效率，支持端侧部署。探索适合大模型的压缩与加速技术（包括但不限于量化、剪枝、知识蒸馏等）。 3、业务场景落地：将多模态技术应用于实际业务场景，如地图数据（道路、POI等）、信息流推荐、打车服务等。与产品、工程团队合作，推动技术从研发到上线的全流程落地。 4、前沿技术探索：持续跟踪生成式AI（Generative AI）、跨模态对齐、思维链强化学习、多模态交互、具身智能等最新技术趋势，提出创新性解决方案。

更新于 2025-04-01北京

感知算法工程师(J240806005)

社招技术

公司介绍滴滴于 2016 年组建自动驾驶技术研发部门，致力于打造世界领先的 L4 级自动驾驶技术，通过科技让出行更安全、更高效。我们相信，将自动驾驶技术部署在共享出行车队中，将创造最大的社会价值。依托滴滴在出行领域的先进技术、海量数据、丰富经验和完整的出行平台生态，我们正在打造并运营世界领先的自动驾驶 Robotaxi 车队，推动自动驾驶在城市复杂交通场景中的规模化落地。职位描述作为感知团队的一员，你将与国内外顶尖人才一起，研究和开发自动驾驶领域的前沿算法，直接赋能 L4 Robotaxi 的大规模部署。你将面向真实城市道路场景中的多样化挑战，利用多模态传感器（LiDAR、Camera、Radar 等）设计、开发并优化感知算法，解决物体识别、障碍物检测、场景理解、意图预测与大模型赋能等核心问题。在这里，你将有机会：与中美两地的优秀工程师和科学家合作，参与世界级的技术竞争；深入研究并推动最前沿的学术成果在产业中的落地；在全球最大出行平台之一的业务场景中，实现科研成果的规模化应用。主要方向与职责：你将在以下方向中选定一个或多个方向深入负责，并承担从研发到落地、从算法到系统的端到端职责：（一）物体识别与跟踪设计并实现基于 LiDAR / Camera / Radar 的多模态检测模型，识别车辆、行人、自行车、静态障碍物、交通标志等提升精度、召回率与抗扰性（抗遮挡、夜间、恶劣天气、长尾类别）（二）通用障碍物识别识别未知类别 /未训练类别的障碍物基于异常检测 /开放类别识别的算法研究与工程实现在非结构化环境（施工区域、道路损坏、落物等）中提升鲁棒性（三）场景和意图理解语义分割、实例分割、道路 /车道/交通标志/交通灯等结构物识别场景理解，例如施工区域识别、可通行区域识别等意图理解，例如行人动作识别、起步意图识别等交互和事件识别，例如多方交互、交通规则冲突、非规范驾驶行为等（四）感知大模型 /多模态探索或应用预训练多模态大模型，将视觉、语言、地图/文本信息融合以增强感知能力零样本 / 少样本 / 跨域泛化的策略研发将大模型成果迁移到真实车队感知系统中，提升复杂场景下的鲁棒性（五）模型评估、验证构建完整的评估管道，包括离线评估 + 真实道路 + 模拟环境测试，支持回归检测与性能监控指标体系设计 (Precision, Recall, IoU, latency, false positives rate 等)

更新于 2026-01-06北京

3d视觉算法工程师(空间理解)(J65435)

社招XYZ

1、负责多模态空间理解算法的研发工作，包括但不限于激光雷达、图像、视频、文本等多模态数据处理、融合和理解 2、设计和研发多任务统一的大模型系统，包括但不限于语义分割、目标检测、OCR识别、reID等 3、支持算法在XR领域的应用，持续优化空间理解的效果和准确率 4、参与团队合作，与团队共同解决空间智能在房产行业落地的技术问题

更新于 2025-02-19北京

算法工程师（cv方向）(MJ027153)

社招旅游业务AI &

1.工作内容包括但不限于视觉和多模态分类/多标签、目标检测、质量评估、图生视频、OCR等 2.参与研究、构建和优化携程视觉/多模态理解和生成大模型 3.支持垂域大规模训练数据集的构建，推动模型的持续升级和优化迭代 4.负责模型的性能优化和模型服务在业务场景上线落地等

更新于 2025-04-08上海