小米机器人全身运动控制算法实习生(强化学习方向)
实习兼职地点:北京状态:招聘
任职要求
1、机器人、计算机、人工智能或相关专业背景,硕士或博士在读优先; 2、掌握主流强化学习算法,熟悉PyTorch或TensorFlow等机器学习框架,有足式机器人控制经验者优先; 3、具备…
登录查看完整任职要求
微信扫码,1秒登录
工作职责
1、负责基于强化学习技术的足式机器人全身运动控制(WBC)算法开发,优化动作的自然性与鲁棒性; 2、推动控制策略在真实机器人上的测试与验证,重点解决仿真到现实(sim2real)的迁移问题; 3、探索全身运动控制算法与机器人操作及多模态语言交互的融合应用; 4、跟踪国内外前沿研究进展,完成相关算法的复现与优化。
包括英文材料
强化学习+
https://cloud.google.com/discover/what-is-reinforcement-learning?hl=en
Reinforcement learning (RL) is a type of machine learning where an "agent" learns optimal behavior through interaction with its environment.
https://huggingface.co/learn/deep-rl-course/unit0/introduction
This course will teach you about Deep Reinforcement Learning from beginner to expert. It’s completely free and open-source!
https://www.kaggle.com/learn/intro-to-game-ai-and-reinforcement-learning
Build your own video game bots, using classic and cutting-edge algorithms.
算法+
https://roadmap.sh/datastructures-and-algorithms
Step by step guide to learn Data Structures and Algorithms in 2025
https://www.hellointerview.com/learn/code
A visual guide to the most important patterns and approaches for the coding interview.
https://www.w3schools.com/dsa/
PyTorch+
https://datawhalechina.github.io/thorough-pytorch/
PyTorch是利用深度学习进行数据科学研究的重要工具,在灵活性、可读性和性能上都具备相当的优势,近年来已成为学术界实现深度学习算法最常用的框架。
https://www.youtube.com/watch?v=V_xro1bcAuA
Learn PyTorch for deep learning in this comprehensive course for beginners. PyTorch is a machine learning framework written in Python.
TensorFlow+
https://www.youtube.com/watch?v=tpCFfeUEGs8
Ready to learn the fundamentals of TensorFlow and deep learning with Python? Well, you’ve come to the right place.
https://www.youtube.com/watch?v=ZUKz4125WNI
This part continues right where part one left off so get that Google Colab window open and get ready to write plenty more TensorFlow code.
还有更多 •••
相关职位

实习算法序列
1.参与足式机器人全身运动控制(Locomotion)算法的设计与优化,构建行业领先的运控基座模型。 2.参与机器人视觉语言导航(VLN)算法的设计和优化,实现开集语言交互下的通用环境导航能力。
更新于 2026-03-16北京
实习
【关于我们】 小鹏机器人中心致力于研发先进的人形机器人技术,包括机器人的行走、操作、智能导航,以及在大语言模型支持下的人机交互等。我们的软硬件团队覆盖深圳、上海、广州、北京和北美,组成了一支世界一流的跨领域团队。作为本团队的一员,你将成为连接人工智能与物理世界的桥梁,与其他领域的工程师共同解决前沿的科研和工程难题,并在机器人技术的发展中留下自己的印记。 负责人形机器人运动控制算法的研究与开发,包括人形机器人建模、协同规划/控制等; 应用先进的运动控制算法,机器学习算法对机器人进行全身控制; 和上下游团队进行深入合作和共同探,深⼊探索未知⼯程和技术领域,影响并参与决策;
更新于 2025-04-14深圳
实习
1. 开发基于强化/模仿学习的机器人行走及全身控制策略; 2. 开发复杂地形下基于视觉的强化学习行走策略; 3. 负责算法策略的训练与移植部署,实现算法sim-to-real在机器人实机上落地应用; 4. 持续跟踪国内外前沿研究成果,并进行相关算法复现; 5. 编写相关技术文档,推动团队技术沉淀与知识共享。
更新于 2025-08-20北京