logo of horizon

地平线VLA强化学习算法实习生

实习兼职算法序列地点:北京状态:招聘

任职要求


1、硕士及以上学历,专业方向为计算机科学、自动化、机器人学或相关领域;
2、具备较强的研究能力与沟通能力,具有强烈的自驱力、责任心和团队合作精神,能独立思考并完成工作;
3、具有机器人操作算法训练经验;
4…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


VLA模型训练策略优化,主要研究强化学习和模仿学习在VLA上如何高效应用。
包括英文材料
学历+
算法+
Python+
还有更多 •••
相关职位

logo of momenta
实习研发

岗位职责 1、负责端到端决策规划算法的开发和迭代; 2、负责训练数据与评测数据的日常挖掘与维护; 3、负责端到端智驾大模型方案的研发迭代体系的建设与完善。

更新于 2026-01-06北京
logo of momenta
实习研发

1、负责端到端决策规划算法的开发和迭代; 2、负责训练数据与评测数据的日常挖掘与维护; 3、负责端到端智驾大模型方案的研发迭代体系的建设与完善。

更新于 2025-12-22北京
logo of meituan
实习核心本地商业-基

深度参与具身智能“感知-决策-行动”技术全链路的技术攻关,在以下一个或多个方向上进行深入研究: 1. 感知与决策规划:提升多模态大模型在具身场景下的能力表现,包括在复杂动态环境中对环境的空间理解,以及对复合任务的任务步骤拆解与任务状态判断能力。 2. 行动与控制:基于真机示教数据、增广数据以及海量互联网视频数据,训练机器人掌握高精度的操作技能。在机器人上研究并实践强化学习算法,优化机器人的动作策略,提升其在物理世界中的动作鲁棒性和技能泛化。 3. 数据增广:通过仿真和world model等方式对真机遥操数据进行规模化增广,探索如何解决真机遥操数据的稀缺问题。

更新于 2025-12-25北京|上海
logo of nio
实习算法

1. 研究和开发先进的机器学习算法, 应用于智能辅助驾驶的各个领域,包括但不限于: - 端到端大模型 (VLA、世界模型等) - 环境感知 (目标检测、语义分割、多传感器融合等) - 决策规划 (路径规划、行为预测、运动控制等) 2. 探索和实现前沿的人工智能技术, 如深度学习、强化学习、计算机视觉、自然语言处理等,以提升智能辅助驾驶系统的性能、安全性和可靠性。 3. 设计和开发大规模数据集, 用于训练和评估智能辅助驾驶算法。

更新于 2025-07-02上海|北京