高德地图高德-多模态大模型算法工程师/专家-图片理解/模型训练方向

社招全职3年以上技术类-算法2026-03-30地点：北京状态：招聘

扫码手机上打开

任职要求

基本条件：
1.  计算机科学、人工智能、机器学习等相关专业硕士及以上学历，3年以上算法研发经验；
2.  坚实的多模态大模型基础：深入理解CLIP、BLIP、LLaVA、Qwen-VL等模型的原理，并有相关实践，如有对图片、视频的理解、生成或编辑能力更加分；
3.  强烈的自驱力与好奇心：对探索AI技术边界充满热情，能主动追踪前沿并快速实验验证，具备优秀的学习能力和韧性。

优先条件：
1.  在多模态理解与生成、视觉-语言…

登录查看完整任职要求

微信扫码，1秒登录

工作职责

职位名称：

团队介绍：
作为中国领先的数字地图内容及导航服务提供商，高德地图日均服务数亿用户出行决策，每日处理超百亿级位置数据。视觉技术中心是驱动高德实现空间智能、高精度地图、三维重建、LLM/VLM，AI Agent等核心技术，持续突破自动驾驶、AR导航、具身智能、推广搜和生活服务等领域的技术边界。团队不仅在计算机视觉领域持续深耕，更将计算机视觉及AI技术在自主导航、高德打车、生活服务等多元化应用场景。 作为高德地图的核心技术驱动部门，我们以下一代三维地图引擎、多模态理解与生成、空间智能、世界模型等方向为核心，推动智能出行与真实世界连接的深度融合。
团队gihub主页：https://github.com/amap-cvlab

为何加入我们？
1.  定义未来地图范式：不再局限于传统视觉感知，而是利用多模态大模型实现从“看到”到“理解并生成”的跨越，解决行业核心痛点
2.  直面海量数据与复杂场景：处理中国乃至全球最复杂、最丰富的驾驶场景数据，构建坚实的技术壁垒
3.  完整的研发生态：从顶级学术研究（顶会论文）、开源项目（见团队GitHub）到国民级应用落地，提供全方位的价值实现舞台

岗位职责：
1.  核心方向：研发面向车道级地图自动化构建的多模态大模型，基于道路图像自动提取车道线、POI信息等地图要素，实现高效、自动化的地图数据生产；
2.  模型全链路研发：负责或参与多模态大模型的预训练、有监督微调（SFT）、奖励模型（RM）训练与强化学习（RL）优化全流程，探索模型在空间推理、结构化生成任务上的能力强化路径；
3.  技术攻坚与落地：优化模型的推理效率、泛化能力与输出稳定性，研究适配的模型压缩（量化、蒸馏）、加速技术与部署方案，推动技术在大规模数据生产管线中落地；
4.  前沿探索与创新：跟踪并吸收多模态理解、视觉生成、世界模型、3DGS等领域的前沿进展，将其创新性地应用于地图生成问题，持续提升自动化生产的质量与范围。

📮 投递简历 ✨AI模拟面试

难度：

包括英文材料

机器学习+

学历+

算法+

大模型+

自动驾驶+

CVPR+

还有更多 •••

登录查看完整学习资料

相关职位

高德-多模态大模型算法工程师/专家-图片理解/模型训练方向

社招3年以上技术类-算法

职位名称：团队介绍：作为中国领先的数字地图内容及导航服务提供商，高德地图日均服务数亿用户出行决策，每日处理超百亿级位置数据。视觉技术中心是驱动高德实现空间智能、高精度地图、三维重建、LLM/VLM，AI Agent等核心技术，持续突破自动驾驶、AR导航、具身智能、推广搜和生活服务等领域的技术边界。团队不仅在计算机视觉领域持续深耕，更将计算机视觉及AI技术在自主导航、高德打车、生活服务等多元化应用场景。作为高德地图的核心技术驱动部门，我们以下一代三维地图引擎、多模态理解与生成、空间智能、世界模型等方向为核心，推动智能出行与真实世界连接的深度融合。团队gihub主页：https://github.com/amap-cvlab 为何加入我们？ 1. 定义未来地图范式：不再局限于传统视觉感知，而是利用多模态大模型实现从“看到”到“理解并生成”的跨越，解决行业核心痛点 2. 直面海量数据与复杂场景：处理中国乃至全球最复杂、最丰富的驾驶场景数据，构建坚实的技术壁垒 3. 完整的研发生态：从顶级学术研究（顶会论文）、开源项目（见团队GitHub）到国民级应用落地，提供全方位的价值实现舞台岗位职责： 1. 核心方向：研发面向车道级地图自动化构建的多模态大模型，基于道路图像自动提取车道线、POI信息等地图要素，实现高效、自动化的地图数据生产； 2. 模型全链路研发：负责或参与多模态大模型的预训练、有监督微调（SFT）、奖励模型（RM）训练与强化学习（RL）优化全流程，探索模型在空间推理、结构化生成任务上的能力强化路径； 3. 技术攻坚与落地：优化模型的推理效率、泛化能力与输出稳定性，研究适配的模型压缩（量化、蒸馏）、加速技术与部署方案，推动技术在大规模数据生产管线中落地； 4. 前沿探索与创新：跟踪并吸收多模态理解、视觉生成、世界模型、3DGS等领域的前沿进展，将其创新性地应用于地图生成问题，持续提升自动化生产的质量与范围。

更新于 2026-03-30北京

多模态大模型算法工程师/专家（搜广推方向）

社招技术类

1、大模型基础模型研发：构建电商领域图像、NLP多模态大模型。持续建设和优化领域预训练、微调、后训练、模型评估等算法迭代，提升业务天花板； 2、推进图像、NLP、多模态大模型在搜索(关键词、图像)、推荐、广告领域全链路算法的落地：改进召回、粗排、精排、重排、相关性、创意等漏斗效率，持续提升各个场景的用户体验、转化效率、GMV、收入指标，持续提升搜索、推荐的智能化水平。 3、推进图像、多模态大模型在图像搜索、同款识别、创意生成等领域的落地，改善图像搜索的用户体验，通过技术创新为用户创造更大的商业价值。

更新于 2026-06-29上海

阿里云智能-多模态大模型算法工程师/专家-模型训练与应用-杭州/北京

社招3年以上云智能集团

1. 模型能力建设与数据飞轮搭建负责 ASR、TTS、Omni、视频生成等多模态模型的能力提升，构建覆盖数据生产、模型微调、对齐优化和评测分析的完整数据飞轮，通过持续迭代提升模型效果、稳定性和泛化能力。 2. 评测驱动的系统级迭代建设科学、全面且贴近业务的评测体系，以评测结果为核心，打通数据生产、系统迭代、问题定位、效果验证和问题修复流程，形成高效、可持续的自迭代系统。 3. 业务场景落地与能力沉淀深入真实业务和客户场景，理解客户需求及实际使用中的关键问题，识别模型与系统优化方向；综合运用模型训练、数据优化、推理策略和工程方案，完成高质量交付，并将场景经验沉淀为可复用、可规模化的系统能力。 4. 多模态融合与对齐推进语音、文本、图像和视频等多模态信息的理解、生成、融合与对齐，解决跨模态表征、时序同步、语义一致性和可控生成等关键问题，提升多模态模型在复杂交互与内容生成场景中的综合表现。 5. 前沿技术探索与工程转化持续跟进多模态大模型、生成式模型、强化学习及模型对齐等方向的前沿进展，结合实际业务需求开展技术验证，并推动研究成果转化为稳定、可用的产品能力。

更新于 2026-07-21北京|杭州

阿里国际站/Alibaba.com-多模态大模型算法工程师/专家-Accio-杭州

社招1年以上技术类-算法

Accio是阿里巴巴国际数字商业集团阿里国际站内部孵化的一款战略级AI原生应用产品，也是全球首个B2B AI Search Agent，通过持续探索Agent、LLM、VLM、RL、Memory、Reasoning、AI Search等前沿技术，自研基座、Agent系统以及AI Search系统，实现全球B2B跨境贸易跨越式发展。 1、参与开发和优化新一代多模态原生AI搜索系统，包括但不限于多模态模型训练、跨模态生成与检索、生成式AI搜、多模态Agent等； 2、参与搜索引擎研发，全链路提升搜索效果，包括但不限于多模态理解、query分析、召回、相关性、排序等关键模块的算法设计与优化； 3、参与买家Agent全链路开发与优化，跟踪前沿多模态大模型技术，探索推动开源SOTA模型的产品化落地。

更新于 2026-04-07杭州