
智能互联高德-大模型/Agent 算法专家-视觉技术中心
任职要求
1. 深入理解 LLM/VLM 模型,熟悉主流 LLM/VLM 的模型结构和训练方法; 2. 熟悉大模型后训练技术,包括但不限于 SFT,RL 等技术,具备Qwen、Llama、Deepseek等模型的二次开发经验者优先; 3.…
工作职责
团队介绍: 作为中国领先的数字地图内容及导航服务提供商,高德地图日均服务数亿用户出行决策,每日处理超百亿级位置数据。视觉技术中心是驱动高德实现高精度地图、三维重建、LLM/VLM,AI Agent等核心技术,持续突破自动驾驶、AR导航、具身智能、推广搜和生活服务等领域的技术边界。团队不仅在计算机视觉领域持续深耕,更将计算机视觉及AI技术在自主导航、高德打车、生活服务等多元化应用场景。 作为高德地图的核心技术驱动部门,我们以下一代三维地图引擎、多模态理解与生成、空间智能、世界模型等方向为核心,推动智能出行与真实世界连接的深度融合。 团队gihub主页: https://github.com/amap-cvlab 为何加入我们? 1. 挑战业界顶尖难题: 处理百亿级位置数据,攻克动态世界中海量POI的实时、精准感知与理解,定义未来地图的“AI之眼”。 2. 驱动国民级应用创新: 你的技术将直接应用于高德地图数亿用户依赖的扫街榜等核心功能,实现从技术突破到产品颠覆的全流程落地。 3. 置身前沿技术浪潮: 在三维地图、世界模型、具身智能等前沿领域进行深度探索与研发。 4. 预研与业务深度结合:在这里,你将同时接触到面向未来的技术预研和支撑亿级用户的业务算法。我们提供从0到1的创新探索环境,也看重从1到N的规模化落地能力。 职位描述: 1.主导基于大模型的AI Agent全生命周期研发,包括通用型及垂直领域AI Agent的应用架构设计、数据构建、模型训练与评测; 2. 运用SFT、RL等Post-training训练方法,探索多模态与RL的结合,提升大模型/多模态大模型在自主规划(Planning)、多步推理、多模态RAG、工具调用、复杂指令理解等方面的能力; 3.跟踪LLM、VLM与Agent领域的国际前沿技术动态,推动技术创新在业务场景中的落地应用。
我们是谁? 作为中国领先的数字地图内容及导航服务提供商,高德地图日均服务数亿用户出行决策,每日处理超百亿级位置数据。视觉技术中心是驱动高德实现厘米级高精地图、实时三维重建、多模态感知等核心技术的引擎,持续突破自动驾驶、AR导航、智慧交通等领域的技术边界。 团队gihub主页:https://github.com/amap-cvlab 为何加入我们? 挑战世界级技术难题,追求智能上限 用AI驱动国民级APP的产品迭代和颠覆式创新 岗位职责: 1. 多模态大模型研发与应用 负责多模态大模型的核心架构设计,研究并实现图片、视频、文本等跨模态特征对齐、融合与表征学习方法,负责多模态大模型的数据准备、高效训练(包括但不限于预训练、SFT、强化学习等)、推理加速等。 2. 模型优化与小型化部署 负责多模态大模型的轻量化设计、压缩与加速,确保模型在端侧设备上的高效运行。 针对高德地图的实际业务场景,优化模型性能,平衡精度与效率。 3. 创新性研究与落地 跟踪端侧生成式AI(Edge Generative AI)、强化学习(PPO、GRPO等)、智能Agent等前沿技术,探索多模态大模型在自动驾驶、智能导航等领域的潜在应用。 将研究成果快速转化为实际产品功能,推动技术创新与业务增长。
团队介绍: 作为中国领先的数字地图内容及导航服务提供商,高德地图日均服务数亿用户出行决策,每日处理超百亿级位置数据。视觉技术中心是驱动高德实现高精度地图、三维重建、LLM/VLM,AI Agent等核心技术,持续突破自动驾驶、AR导航、具身智能、推广搜和生活服务等领域的技术边界。团队不仅在计算机视觉领域持续深耕,更将计算机视觉及AI技术在自主导航、高德打车、生活服务等多元化应用场景。 作为高德地图的核心技术驱动部门,我们以下一代三维地图引擎、多模态理解与生成、空间智能、世界模型等方向为核心,推动智能出行与真实世界连接的深度融合。 团队gihub主页:https://github.com/amap-cvlab 为何加入我们? 挑战世界级技术难题,追求智能上限 用AI驱动国民级APP的产品迭代和颠覆式创新 我们正在寻找对多模态技术充满热情的算法工程师,加入我们的研发团队。您将专注于多模态理解与生成,推动其在高德扫街榜等热门应用中落地,为用户提供更智能、更沉浸的服务。 主要职责: 1、多模态大模型研发:开发业界领先的图文多模态大模型,实现高质量场景理解和内容生成; 2、模型优化与性能提升:优化多模态模型的推理速度和计算效率,支持端侧部署。探索适合大模型的压缩与加速技术(包括但不限于量化、剪枝、知识蒸馏等); 3、业务场景落地:将多模态技术应用于扫街榜等实际业务场景,与产品、工程团队合作,推动技术从研发到上线的全流程落地; 4、前沿技术探索:持续跟踪生成式AI、跨模态对齐、思维链、强化学习、多模态交互等最新技术趋势,提出创新性解决方案。
我们正在寻找在具身智能VLA(视觉-语言-动作)、空间计算(重建、SLAM等)及强化学习领域有深厚积累的算法同学,加入高德地图视觉技术中心。你将参与构建下一代地图中的感知、理解与决策系统,推动具身导航、AR/VR、场景建模等前沿技术的研发与落地。 如果你热衷于用AI改变人们出行方式,渴望在真实世界大规模数据上验证算法能力,欢迎加入我们! 岗位职责: ● 负责视觉语言动作(VLA)的具身智能模型和视觉语言模型(VLM)的研发,提升具身agent的空间理解和行动决策能力; ● 推进空间计算相关技术(如SLAM、三维重建、点云处理、姿态估计等)在下一代地图、虚拟现实等场景的应用; ● 探索强化学习在多模态大模型的后训练中的应用,提升具身/空间智能的能力天花板; ● 跟踪国际前沿技术发展,持续推动技术创新,并落实到实际应用中; ● 与工程团队紧密协作,完成从算法研发到系统部署的全流程闭环。
我们正在寻找在具身智能VLA(视觉-语言-动作)、空间计算(重建、SLAM等)及强化学习领域有深厚积累的算法同学,加入高德地图视觉技术中心。你将参与构建下一代地图中的感知、理解与决策系统,推动具身导航、AR/VR、场景建模等前沿技术的研发与落地。 如果你热衷于用AI改变人们出行方式,渴望在真实世界大规模数据上验证算法能力,欢迎加入我们! 岗位职责: ● 负责视觉语言动作(VLA)的具身智能模型和视觉语言模型(VLM)的研发,提升具身agent的空间理解和行动决策能力; ● 推进空间计算相关技术(如SLAM、三维重建、点云处理、姿态估计等)在下一代地图、虚拟现实等场景的应用; ● 探索强化学习在多模态大模型的后训练中的应用,提升具身/空间智能的能力天花板; ● 跟踪国际前沿技术发展,持续推动技术创新,并落实到实际应用中; ● 与工程团队紧密协作,完成从算法研发到系统部署的全流程闭环。