高德地图高德-VLA实习生

实习兼职高德研究型实习生2026-02-24地点：北京状态：招聘

扫码手机上打开

任职要求

招聘要求
1. 学历与专业背景
    ○ 硕士及以上学历，计算机科学、人工智能、机器人学、自动化、电子工程等相关专业；博士或有顶会发表者优先。
2. 核心技术能力
    ○ 熟悉主流 VLA 模型：OpenVLA、RT-1/RT-2、Pi0、RDT、ACT、Diffusion Policy 等；
    ○ 熟悉多模态大模型：Llava、Qwen-VL、CLIP、PaLM-E、RFM、R3M 等；
    ○ 掌握基础 CV 模型：ViT、DINO、SAM、Diffusion、GAN；熟悉 NLP 模型：BERT、GPT、LLaMA 系列；
    ○ 熟悉 PyTorch，熟练使用 ROS、TensorFlow、JAX 等框架；编程语言以 Python 为主，熟悉 C/C+…

登录查看完整任职要求

微信扫码，1秒登录

工作职责

职位概述
我们正在寻找在视觉-语言-动作（Vision-Language-Action, VLA）领域具有扎实理论基础和丰富实践经验的算法工程师或研究员，致力于构建下一代通用智能机器人系统。你将参与从数据构建、模型设计到仿真训练与实机部署的全链路研发，推动 VLA 大模型在机械臂操作、人形机器人控制等复杂工业与开放场景中的前沿探索与实际落地。

职位描述（Responsibilities）
1. 前沿算法研究与复现
    ○ 跟踪 VLA 领域最新进展（如 OpenVLA、RT-2、Pi0、RDT、Diffusion Policy 等），完成 SOTA 算法在仿真与实机环境下的复现与性能分析；
    ○ 探索基于大模型的端到端机器人决策框架，实现感知→理解→规划→动作的闭环。
2. VLA 模型架构设计与优化
    ○ 设计面向工业场景的 VLA 模型结构，重点解决多模态特征对齐、动作序列生成、推理效率优化等问题；
    ○ 提升机械臂在复杂任务中的操作精度、泛化能力与鲁棒性。
3. Scaling 研究与泛化能力提升
    ○ 开展 VLA 的 scaling law 研究，涵盖数据规模、模型结构、机器人构型等维度；
    ○ 实现长序列任务执行、跨任务技能迁移与动作泛化，在更复杂的工厂或开放环境中验证模型上限。
4. 数据系统与自动标注开发
    ○ 参与多模态大模型所需的数据清洗、自动标注与增强系统的开发；
    ○ 探索高效的数据合成方法（如 sim2real 数据生成、LLM 辅助标注），保障数据质量与多样性。
5. 仿真训练与真实部署
    ○ 基于 Isaac Sim / Gym / Lab、MuJoCo 等平台搭建高保真仿真环境，构建强化学习与模仿学习训练框架；
    ○ 设计 real2sim2real 迁移策略，加速算法从仿真到现实世界的部署；
    ○ 具备实机调试经验，能独立完成模型在机械臂或人形机器人上的部署与迭代。

📮 投递简历 ✨AI模拟面试

难度：

包括英文材料

学历+

大模型+

NLP+

BERT+

GPT+

Llama+

PyTorch+

ROS+

还有更多 •••

登录查看完整学习资料

相关职位

具身智能数据与VLA 实习生

校招

岗位职责参与具身智能 VLA（Vision-Language-Action）模型的数据体系建设，包括机器人操作数据采集、标注、清洗、质检与管理负责多模态数据处理流程开发与维护，涵盖视觉、语言、动作、触觉等数据的组织与对齐搭建和优化大规模机器人数据 pipeline，包括数据上传、存储、版本管理、预处理与训练集构建参与 VLA 模型训练与迭代，包括数据格式设计、训练配置、效果评估与 benchmark 分析安克实习生项目是面向正式校招岗位的人才培养与选拔通道。实习期间将按照校招标准进行系统的培养与综合评估，表现优秀者可直接获得校招转正机会，提前锁定正式校招席位。我们以严肃、长期的视角对待每一位实习生，也期待与你共同成长。【你将参与】 1.跟踪前沿 VLA 与具身智能方向论文（如 RT-2、OpenVLA、Pi0、Diffusion Policy、ACT 等），完成数据流程或模型方案复现与实验对比 2.协助机器人数据平台与工程化系统建设，提升数据采集效率、数据一致性与训练稳定性 3.与算法、数据采集、机器人控制团队协作，推动具身智能数据闭环与模型迭代

更新于 2026-05-11深圳

VLA算法实习生

实习

多模态大模型（VLA：Vision-Language-Action）算法的预研, 包含但不限于： 1. 研究视觉、语言与行为动作之间的联合建模机制，探索多模态预训练与表征学习方法，实现跨模态对齐与融合； 2. 多模态数据集的构建与管理，包括视觉、语言、行为等多模态标签设计与质量控制； 3. 探索模型蒸馏、小样本泛化等技术，推动模型在自动驾驶复杂场景中的部署效率； 4. 跟进并复现前沿研究（如 EMMA、RT-2、OpenVLA等），协助撰写技术报告、论文或专利材料。 5. 深入调研并实践 RLHF / DPO 等对齐技术，提升多模态模型的响应能力与行为决策能力； 6. 撰写高质量的技术文档，参与论文发表或专利申请。

更新于 2025-11-14上海

VLA算法实习生

实习

更新于 2026-01-06北京

VLA算法实习生

实习算法序列

【岗位职责】 -突破时序编码瓶颈：引入 Test-time-training 等技术，实现对物理世界时序信息的高效压缩与编码，在保持性能的同时，将 token 规模与算力开销降至可部署级别。 -构建场景化 VLA 数据体系：基于驾驶场景，构建覆盖空间感知、时序行为、长尾场景与因果推理的结构化数据体系，提升模型对物理世界的理解深度。 -实现实时闭环决策：在车载边缘设备上实现 24FPS 以上的实时推理，让模型从 “被动感知” 进化为 “主动决策”，支撑自动驾驶的长程规划与安全交互。

更新于 2026-03-16北京|上海|香港