
地平线机器人操作方向实习生
实习兼职算法序列地点:北京 | 上海状态:招聘
任职要求
- 计算机、机器人等相关领域在读研究生(博士优先),具备扎实的理论基础、代码能力和研究能力; - 对强化学习、VLM、VLA、CoT等技术方向有较深入的了解和实践经验; - 良好的沟通能力、团队协作精神以及较强的英文技术写作能力; - 每周实习>=4天,3个月以上; 加分项 - 有较强的论文复现能力,在机器人、计算机视觉、…
登录查看完整任职要求
微信扫码,1秒登录
工作职责
-参与具身智能中强化学习微调、VLA模型、CoT模型等方向的算法研究; - 对研究成果撰写技术报告和学术论文;
包括英文材料
强化学习+
https://cloud.google.com/discover/what-is-reinforcement-learning?hl=en
Reinforcement learning (RL) is a type of machine learning where an "agent" learns optimal behavior through interaction with its environment.
https://huggingface.co/learn/deep-rl-course/unit0/introduction
This course will teach you about Deep Reinforcement Learning from beginner to expert. It’s completely free and open-source!
https://www.kaggle.com/learn/intro-to-game-ai-and-reinforcement-learning
Build your own video game bots, using classic and cutting-edge algorithms.
OpenCV+
https://learnopencv.com/getting-started-with-opencv/
At LearnOpenCV we are on a mission to educate the global workforce in computer vision and AI.
https://opencv.org/university/free-opencv-course/
This free OpenCV course will teach you how to manipulate images and videos, and detect objects and faces, among other exciting topics in just about 3 hours.
相关职位

实习算法序列
1、基于Isaac Sim / IsaacLab 进行机器人任务仿真环境构建与维护 2、参与仿真数据合成与数据管线优化 3、搭建VLA模型的仿真评测流程,参与 benchmark 设计与实现 4、与算法/模型团队协作,定位仿真与真实行为之间的差异
更新于 2026-01-23上海
实习
1、负责基于强化学习技术的足式机器人全身运动控制(WBC)算法开发,优化动作的自然性与鲁棒性; 2、推动控制策略在真实机器人上的测试与验证,重点解决仿真到现实(sim2real)的迁移问题; 3、探索全身运动控制算法与机器人操作及多模态语言交互的融合应用; 4、跟踪国内外前沿研究进展,完成相关算法的复现与优化。
更新于 2025-06-23北京

实习技术族-实习
1、模型复现与实现:复现当前主流的开源VLA模型(如GR00T/ π0.5/SmoIVLA/WALL-OSS等),确保算法正确性和性能。 2、系统集成与测试:将VLA模型集成到公司机器人平台,设计并执行测试方案,评估模型在真实环境中的感知、推理与执行能力。 3、算法优化与创新:针对机器人具体应用场景,对VLA模型进行微调、优化及创新,提升其在复杂环境下的适应性和鲁棒性。 4、多模态数据处理:处理视觉、语言和动作数据,构建和优化训练数据集,支持模型的训练和评估。 5、技术跟踪与报告:跟踪VLA领域的最新研究进展,撰写技术报告,并参与团队技术讨论与分享。
更新于 2025-11-03北京