高德地图高德-多模态大模型/端侧部署算法工程师/专家-视觉团队

社招全职3年以上技术类-算法2026-02-02地点：北京状态：招聘

扫码手机上打开

任职要求

1. 学历背景
    计算机科学、人工智能、机器学习等相关专业硕士及以上学历，博士优先。
2. 技术能力
    精通多模态大模型（如CLIP、BLIP、Flamingo、Qwen-VL等）的原理与应用，掌握指令微调、LoRA等高效微调方法，具备相关项目经验。
    熟练掌握至少一种深度学习框架（如PyTorch、TensorFlow等），能够独立完成模型的设计、训练与优化。
    在模型小型化、压缩与加速方面有实际经验（如量化、剪枝、蒸馏等）。
    具备扎实的计算机视觉、自然语言处理或多模态学习基础。
3. 实践经验
…

登录查看完整任职要求

微信扫码，1秒登录

工作职责

我们是谁？  
作为中国领先的数字地图内容及导航服务提供商，高德地图日均服务数亿用户出行决策，每日处理超百亿级位置数据。视觉技术中心是驱动高德实现厘米级高精地图、实时三维重建、多模态感知等核心技术的引擎，持续突破自动驾驶、AR导航、智慧交通等领域的技术边界。
团队gihub主页：https://github.com/amap-cvlab

为何加入我们？  
挑战世界级技术难题，追求智能上限 
用AI驱动国民级APP的产品迭代和颠覆式创新

岗位职责：
1. 多模态大模型研发与应用
   负责多模态大模型的核心架构设计，研究并实现图片、视频、文本等跨模态特征对齐、融合与表征学习方法，负责多模态大模型的数据准备、高效训练（包括但不限于预训练、SFT、强化学习等）、推理加速等。
2. 模型优化与小型化部署
    负责多模态大模型的轻量化设计、压缩与加速，确保模型在端侧设备上的高效运行。
    针对高德地图的实际业务场景，优化模型性能，平衡精度与效率。
3. 创新性研究与落地
    跟踪端侧生成式AI（Edge Generative AI）、强化学习（PPO、GRPO等）、智能Agent等前沿技术，探索多模态大模型在自动驾驶、智能导航等领域的潜在应用。
    将研究成果快速转化为实际产品功能，推动技术创新与业务增长。

📮 投递简历 ✨AI模拟面试

难度：

包括英文材料

学历+

自动驾驶+

SLAM+

强化学习+

深度学习+

PyTorch+

TensorFlow+

Python+

C+++

CVPR+

还有更多 •••

登录查看完整学习资料

相关职位

高级多模态算法工程师（端侧模型方向）-博士

校招AI/算法类

1. 负责多模态大模型压缩算法研发，探索并实现极低bit量化技术和稀疏化技术，保持推理精度的同时减少模型存储和计算资源消耗； 2. 负责多模态大模型编解码加速算法研发，降低端侧模型推理成本； 3. 参与端侧大模型技术体系建设，探索和实现高效大模型架构，开发和优化内部模型端侧化部署工具链。 4. 跟进大模型前沿技术发展趋势，探索相关算法的创新优化，发表高质量研究论文。

更新于 2025-07-14北京

高德-多模态大模型算法工程师-视觉团队

社招3年以上技术类-算法

我们正在寻找对多模态技术充满热情的算法工程师，加入我们的前沿技术研发团队。您将专注于多模态理解与生成，推动其在地图数据、信息流推荐、打车服务等场景中的落地应用，为用户提供更智能、更沉浸的服务。主要职责 1、多模态模型研发：开发业界领先的图文多模态理解与生成模型，结合扩散模型（Diffusion Models）、Transformer架构等实现高质量场景理解和动态内容生成。 2、模型优化与性能提升：优化多模态模型的推理速度和计算效率，支持端侧部署。探索适合大模型的压缩与加速技术（包括但不限于量化、剪枝、知识蒸馏等）。 3、业务场景落地：将多模态技术应用于实际业务场景，如地图数据（道路、POI等）、信息流推荐、打车服务等。与产品、工程团队合作，推动技术从研发到上线的全流程落地。 4、前沿技术探索：持续跟踪生成式AI（Generative AI）、跨模态对齐、思维链强化学习、多模态交互、具身智能等最新技术趋势，提出创新性解决方案。

更新于 2025-04-01北京

高德-多模态大模型应用算法工程师-视觉技术团队

社招3年以上技术类-算法

团队介绍：作为中国领先的数字地图内容及导航服务提供商，高德地图日均服务数亿用户出行决策，每日处理超百亿级位置数据。视觉技术中心是驱动高德实现高精度地图、三维重建、LLM/VLM，AI Agent等核心技术，持续突破自动驾驶、AR导航、具身智能、推广搜和生活服务等领域的技术边界。团队不仅在计算机视觉领域持续深耕，更将计算机视觉及AI技术在自主导航、高德打车、生活服务等多元化应用场景。作为高德地图的核心技术驱动部门，我们以下一代三维地图引擎、多模态理解与生成、空间智能、世界模型等方向为核心，推动智能出行与真实世界连接的深度融合。团队gihub主页：https://github.com/amap-cvlab 为何加入我们？挑战世界级技术难题，追求智能上限用AI驱动国民级APP的产品迭代和颠覆式创新我们正在寻找对多模态技术充满热情的算法工程师，加入我们的研发团队。您将专注于多模态理解与生成，推动其在高德扫街榜等热门应用中落地，为用户提供更智能、更沉浸的服务。主要职责： 1、多模态大模型研发：开发业界领先的图文多模态大模型，实现高质量场景理解和内容生成； 2、模型优化与性能提升：优化多模态模型的推理速度和计算效率，支持端侧部署。探索适合大模型的压缩与加速技术（包括但不限于量化、剪枝、知识蒸馏等）； 3、业务场景落地：将多模态技术应用于扫街榜等实际业务场景，与产品、工程团队合作，推动技术从研发到上线的全流程落地； 4、前沿技术探索：持续跟踪生成式AI、跨模态对齐、思维链、强化学习、多模态交互等最新技术趋势，提出创新性解决方案。

更新于 2025-12-11北京

阿里云智能-行业解决方案架构师（股份制）-新金融行业线（广州/深圳）

社招3年以上云智能集团

1. 行业解决方案设计与交付 - 基于阿里云大模型技术（如通义千问），为银行、保险、证券等金融客户量身定制AI大模型解决方案，覆盖AI财富助手、智能客服、智能风控等核心场景。 - 深入理解客户业务痛点，提供从需求分析、技术选型到方案落地的全流程支持，确保大模型技术与金融业务深度融合。 2. 大模型全生命周期技术赋能 - 主导客户侧大模型后训练（Post-training）、领域微调（Domain-specific Fine-tuning）、模型蒸馏（Distillation）及多模态融合优化，提升模型在金融垂直场景的精度及性能。 - 优化大模型训练与推理性能，包括分布式训练加速（如DeepSpeed、Megatron-LM）、显存优化、量化压缩（INT8/FP16）及低延迟推理部署（如vLLM、SGLang）等。 3. 工程化落地与性能调优 - 解决金融场景高并发、高稳定性需求，设计高性能计算架构，优化模型在GPU/TPU集群的训练效率及端到端推理链路。 - 结合金融行业数据隐私与安全要求，设计符合监管的模型部署方案。 4. 客户技术赋能与生态共建 - 面向客户技术团队提供大模型技术培训、实战工作坊及POC验证，推动AI能力在客户内部的规模化应用。 - 沉淀金融行业大模型最佳实践，输出白皮书、案例研究及标准化解决方案，提升阿里云在金融AI领域的市场影响力。

更新于 2025-12-09深圳|广州