高德地图高德-多模态大模型算法工程师/专家-内容理解和AIGC生成方向

社招全职2年以上技术类-算法2025-11-03地点：北京状态：招聘

扫码手机上打开

任职要求

1. 硕士及以上学历，在深度学习、计算机视觉、自然语言处理等领域具备扎实的基础，掌握领域内的最新技术进展；
2. 良好的团队合作精神和沟通能力，对先进技术的探…

登录查看完整任职要求

微信扫码，1秒登录

工作职责

团队介绍：
高德地图机器学习研发部是公司AI核心技术引擎，聚焦多模态大模型、视频生成与理解、图像编辑与生成等前沿领域。团队深耕人工智能技术落地，支撑亿级用户产品，同时长期投入前沿探索，在NeurIPS/ICLR/CVPR/ACL等顶会发表多篇论文，多项成果入选“最有影响力论文”榜单。我们拥有海量数据与算力资源，鼓励创新突破，诚邀你与顶尖算法专家并肩，共同定义AI的未来！如果你渴望挑战多模态与生成式AI的技术巅峰，在视频、图像、大模型的交叉领域实现突破，欢迎加入我们！团队的github页面是：https://github.com/AMAP-ML/

我们提供
• 参与亿级用户产品的AI核心算法研发，见证技术直接赋能业务；
• 与学术大牛和工业界专家共事，持续提升技术视野；
• 顶配算力资源+开放创新氛围，支持前沿探索与顶会论文发表。

具体职责包含但不限于：
1. 视觉理解任务的技术探索，要求对视觉基础任务有深入的理解，做好在商品理解、详情页的文图内容、开放图片识别等公司核心业务上的落地；
2. 多模态大模型的技术探索，要求对多模态大模型训练、文图跨模态对齐等有深入实践，做好多模态大模型的能力构建和应用；
3. 追踪领域前沿工作，沉淀技术，投稿领域顶级会议。

📮 投递简历 ✨AI模拟面试

难度：

包括英文材料

深度学习+

OpenCV+

NLP+

C+

C+++

Java+

Python+

TensorFlow+

还有更多 •••

登录查看完整学习资料

相关职位

高德-多模态内容理解算法工程师/专家-视觉技术中心

社招3年以上技术类-算法

负责图像、视频内容理解相关的大模型研发工作，包括但不限于视觉描述生成（Video Caption）、视觉问答（VQA）、多模态大模型（MLLM）等技术，通过内容理解相关算法在业务中的探索与应用，解决实际业务问题；

更新于 2025-09-23北京

高德-大模型算法工程师/专家-多模态理解方向

社招2年以上技术类-算法

围绕高德的核心业务场景，研究大模型与推荐结合提升业务效果并落地，不限于LLM、多模态大模型SFT、RLHF、多模态理解、内容表征、推荐算法、行为序列建模、搜索算法。团队介绍：团队由国内外知名高校及主流互联网企业的资深专家组成，在顶尖期刊（如KDD、NeurIPS、ICLR、ICML、AAAI等）发表过多篇论文，是国内理论与应用实践相结合、应用算法创新的顶尖和超一流团队。

更新于 2025-09-25北京

高德-多模态大模型算法工程师/专家-图片理解/模型训练方向

社招3年以上技术类-算法

职位名称：团队介绍：作为中国领先的数字地图内容及导航服务提供商，高德地图日均服务数亿用户出行决策，每日处理超百亿级位置数据。视觉技术中心是驱动高德实现空间智能、高精度地图、三维重建、LLM/VLM，AI Agent等核心技术，持续突破自动驾驶、AR导航、具身智能、推广搜和生活服务等领域的技术边界。团队不仅在计算机视觉领域持续深耕，更将计算机视觉及AI技术在自主导航、高德打车、生活服务等多元化应用场景。作为高德地图的核心技术驱动部门，我们以下一代三维地图引擎、多模态理解与生成、空间智能、世界模型等方向为核心，推动智能出行与真实世界连接的深度融合。团队gihub主页：https://github.com/amap-cvlab 为何加入我们？ 1. 定义未来地图范式：不再局限于传统视觉感知，而是利用多模态大模型实现从“看到”到“理解并生成”的跨越，解决行业核心痛点 2. 直面海量数据与复杂场景：处理中国乃至全球最复杂、最丰富的驾驶场景数据，构建坚实的技术壁垒 3. 完整的研发生态：从顶级学术研究（顶会论文）、开源项目（见团队GitHub）到国民级应用落地，提供全方位的价值实现舞台岗位职责： 1. 核心方向：研发面向车道级地图自动化构建的多模态大模型，基于道路图像自动提取车道线、POI信息等地图要素，实现高效、自动化的地图数据生产； 2. 模型全链路研发：负责或参与多模态大模型的预训练、有监督微调（SFT）、奖励模型（RM）训练与强化学习（RL）优化全流程，探索模型在空间推理、结构化生成任务上的能力强化路径； 3. 技术攻坚与落地：优化模型的推理效率、泛化能力与输出稳定性，研究适配的模型压缩（量化、蒸馏）、加速技术与部署方案，推动技术在大规模数据生产管线中落地； 4. 前沿探索与创新：跟踪并吸收多模态理解、视觉生成、世界模型、3DGS等领域的前沿进展，将其创新性地应用于地图生成问题，持续提升自动化生产的质量与范围。

更新于 2026-02-11北京

蚂蚁集团-多模态大模型算法工程师 (视觉语言方向)-杭州【AI Force】

社招技术类-算法

我们正在寻找一位充满激情的多模态算法专家，加入我们的前沿AI团队。你将专注于构建和训练先进的视觉语言大模型（Multimodal Large Models），推动技术在图像/视频内容理解与生成领域的创新。【职位描述】 1.核心研发：负责视觉语言大模型的核心算法研发，主攻图像/视频描述生成 (Image/Video Captioning)、视觉问答 (VQA) 等关键任务。 2.模型训练：主导或深度参与多模态大模型的完整训练流程，包括数据构建、模型架构设计（如 Vision Encoder + LLM）、预训练与指令微调 (Instruction-Tuning)。 3.技术落地：负责模型性能的评估、优化与迭代，探索量化、蒸馏等技术，并推动模型在实际业务场景中的部署与应用。

更新于 2025-06-27杭州