地平线VLA强化学习算法实习生

实习兼职算法序列2026-01-28地点：北京状态：招聘

扫码手机上打开

任职要求

1、硕士及以上学历，专业方向为计算机科学、自动化、机器人学或相关领域；
2、具备较强的研究能力与沟通能力，具有强烈的自驱力、责任心和团队合作精神，能独立思考并完成工作；
3、具有机器人操作算法训练经验；
4…

登录查看完整任职要求

微信扫码，1秒登录

工作职责

VLA模型训练策略优化，主要研究强化学习和模仿学习在VLA上如何高效应用。

📮 投递简历 ✨AI模拟面试

难度：

包括英文材料

学历+

算法+

Python+

还有更多 •••

登录查看完整学习资料

相关职位

VLA算法工程师-27届蓝极星

校招

我们是vivo机器人LAB团队，致力于研究和探索面向未来十年的智能终端演进趋势，承担公司在具身智能方向的前瞻探索与产品落地任务。加入我们，你将与一群探索未来的专家们并肩作战，将接触最前沿的具身智能相关趋势和技术，一起探索和定义下一代智能终端的形态与边界！你将与我们一起专注于： 1、VLA算法研发：开展机器人场景VLA核心算法优化，跟进前沿技术，解决决策控制核心痛点； 2、模型训练与性能优化：搭建机器人VLA模型训练体系，完成分布式训练迭代，优化模型泛化性、鲁棒性与推理效率； 3、训练数据体系建设：对接数据工程师完成VLA数据采集、清洗全流程管控，持续提升数据质量，实现模型效果迭代优化； 4、算法工程化部署：完成算法工程化封装与真机迁移，对接机器人底层系统，实现真机部署联调； 5、技术文档撰写：撰写维护全流程技术文档，参与核心专利申报，沉淀技术知识库，规范技术资产管理。

更新于 2026-06-17东莞

VLA大模型算法实习生

实习

1、负责VLA自动驾驶大模型的研发及在车端量产落地等工作； 2、解决VLA在实际量产项目中的问题，基于 Agent 开发自动化问题分析工具； 3、参与构建高质量 VLA Benchmark 系统，包括场景挖掘、难例挖掘及模型评测（Reward Model）等。

更新于 2026-07-16深圳

VLA算法实习生

实习

多模态大模型（VLA：Vision-Language-Action）算法的预研, 包含但不限于： 1. 研究视觉、语言与行为动作之间的联合建模机制，探索多模态预训练与表征学习方法，实现跨模态对齐与融合； 2. 多模态数据集的构建与管理，包括视觉、语言、行为等多模态标签设计与质量控制； 3. 探索模型蒸馏、小样本泛化等技术，推动模型在自动驾驶复杂场景中的部署效率； 4. 跟进并复现前沿研究（如 EMMA、RT-2、OpenVLA等），协助撰写技术报告、论文或专利材料。 5. 深入调研并实践 RLHF / DPO 等对齐技术，提升多模态模型的响应能力与行为决策能力； 6. 撰写高质量的技术文档，参与论文发表或专利申请。

更新于 2025-11-14上海

VLA/VLN算法实习生

实习

1. VLA/VLN算法开发：研究并实现Vision-Language-Action (VLA) / Vision-Language Navigation（VLN）算法，使机器人能够根据自然语言指令以及当前场景进行自主移动； 2. 多模态融合：开发视觉、语言、地图等多模态信息融合模块，提升导航决策的准确性； 3. 场景理解：实现基于视觉和语言的场景语义理解，支持复杂环境下的目标定位与路径规划； 4. 模型训练与优化：负责VLA/VLN模型的训练、调优及推理性能优化； 5. 数据与评测：参与导航数据集构建、评测指标设计及Benchmark开发。

更新于 2025-12-01深圳