logo of amap

高德地图高德-VLA/WAM算法工程师/专家-具身业务

社招全职1年以上技术类-算法地点:北京状态:招聘

任职要求


1.硕士及以上学历,VLA或WAM相关背景,熟悉真机加速与部署,不限工作年限。
2.具备代表性项目或…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


高德地图视觉技术中心(AMAP CV Lab)
高德地图日均服务数亿用户,每日处理超百亿级位置与视觉数据。视觉技术中心是高德的核心技术引擎,视觉技术中心是高德的核心技术引擎,深耕空间智能、具身智能、世界模型等AGI前沿方向。我们的核心使命:以空间智能为锚点,打造物理世界的智能体操作系统 ABot。我们不做“刷榜模型”,而是打造能在开放世界中自主决策、安全执行、持续进化的智能体系统。你的研究,将直接改变数亿人的出行方式。
GitHub 主页:https://github.com/amap-cvlab

我们的优势:独一无二的“空间智能-场景-生态”三角
● 空间智能深度:全栈覆盖三维重建、世界模型、多模态、具身导航、LLM/VLM/VLA/AI Agent,所有技术都服务于“让AI理解并作用于物理空间”。
● 场景广度:亿级用户真实验证,从封闭测试到开放街道,技术必须经得起现实世界的“毒打”,空间智能不能只存在于实验室。
● 生态高度:清华大学、北京大学、港科、中科院等深度合作,主导开源标准,你不是孤军奋战,而是站在全球空间智能研究的前沿。

我们正在寻找在视觉-语言-动作(Vision-Language-Action, VLA)领域具有扎实理论基础和丰富实践经验的算法工程师或研究员,致力于构建下一代通用智能机器人系统。你将参与从数据构建、模型设计到仿真训练与实机部署的全链路研发,推动 VLA 大模型在机械臂操作、人形机器人控制等复杂工业与开放场景中的前沿探索与实际落地。

岗位职责:
1. 前沿算法研究与复现
    ○ 跟踪 VLA/WAM 领域最新进展(如 OpenVLA、RT-2、Pi0、Diffusion Policy、DreamZero、Lingbot-VA 等),完成 SOTA 算法在仿真与实机环境下的复现与性能分析;
    ○ 探索基于大模型的端到端机器人决策框架,实现感知→理解→规划→动作的闭环。
2. VLA/WAM 模型架构设计与优化
    ○ 设计面向工业场景的 VLA 模型结构,重点解决多模态特征对齐、动作序列生成、推理效率优化等问题;
    ○ 提升机械臂在复杂任务中的操作精度、泛化能力与鲁棒性。
3. Scaling 研究与泛化能力提升
    ○ 开展 VLA/WAM 的 scaling law 研究,涵盖数据规模、模型结构、机器人构型等维度;
    ○ 实现长序列任务执行、跨任务技能迁移与动作泛化,在更复杂的工厂或开放环境中验证模型上限。
4. 数据系统与自动标注开发
    ○ 参与多模态大模型所需的数据清洗、自动标注与增强系统的开发;
    ○ 探索高效的数据合成方法(如 sim2real 数据生成、LLM 辅助标注),保障数据质量与多样性。
5. 仿真训练与真实部署
    ○ 基于 Isaac Sim / Gym / Lab、MuJoCo 等平台搭建高保真仿真环境,构建强化学习与模仿学习训练框架;
    ○ 设计 real2sim2real 迁移策略,加速算法从仿真到现实世界的部署;
    ○ 具备实机调试经验,能独立完成模型在机械臂或人形机器人上的部署与迭代。
包括英文材料
学历+