小鹏汽车强化学习算法工程师（人形机器人运动控制方向）

社招全职2025-04-28地点：深圳 | 上海状态：招聘

扫码手机上打开

任职要求

1. 硕士及以上学历，自动化、计算机、人工智能等专业；
2. 扎实的机器学习理论功底和编程能力；
3. 熟悉主流深度学习、强化学习训练框架，熟悉issac …

登录查看完整任职要求

微信扫码，1秒登录

工作职责

1. 研发基于强化学习的人形机器人全身运动控制算法；
2. 搭建强化学习运动控制算法完整训练流程并优化性能；
3. 分析评估算法性能，迭代优化控制策略；
4. 与团队协作，推动强化学习算法部署调试测试；
5. 跟进人形机器人全身运动控制算法，为团队引入新思路，保持技术领先性。

📮 投递简历 ✨AI模拟面试

难度：

包括英文材料

学历+

机器学习+

还有更多 •••

登录查看完整学习资料

相关职位

【25届校招】强化学习算法工程师（人形机器人运动控制方向）

校招

1. 研发基于强化学习的人形机器人全身运动控制算法； 2. 搭建强化学习运动控制算法完整训练流程并优化性能； 3. 分析评估算法性能，迭代优化控制策略； 4. 与团队协作，推动强化学习算法部署调试测试； 5. 跟进人形机器人全身运动控制算法，为团队引入新思路，保持技术领先性。

更新于 2025-04-28深圳

RLHF强化学习算法工程师

社招3年以上

我们致力于推动强化学习（Reinforcement Learning, RL）在人形机器人运动控制、大语言模型推理优化、和具身智能体（Embodied AI）领域的突破性应用。现招募具备深厚RL技术背景的算法工程师，参与从算法设计、仿真训练到真实场景部署的全链路研发，探索AI与物理世界的深度融合。 1. 研究大语言模型RLHF阶段的广义强化算法，提升大模型的能力，探索大模型的自我进化之路； 2. 研究大模型驱动的智能体算法，包括但是不局限于ReACT、Voyager、WebGPT、AutoGPT； 3. 撰写技术报告和论文，分享研究成果，参与内外部的技术交流和合作，推动团队技术水平的提升，提高团队在行业内的影响力。

更新于 2025-03-04上海|深圳

【26届校招】人形机器人运动控制算法工程师

校招

【关于我们】小鹏机器人中心致力于研发先进的人形机器人技术，包括机器人的行走、操作、智能导航，以及在大语言模型支持下的人机交互等。我们的软硬件团队覆盖深圳、上海、广州、北京和北美，组成了一支世界一流的跨领域团队。作为本团队的一员，你将成为连接人工智能与物理世界的桥梁，与其他领域的工程师共同解决前沿的科研和工程难题，并在机器人技术的发展中留下自己的印记。负责人形机器人运动控制算法的研究与开发，包括人形机器人建模、协同规划/控制等；应用先进的运动控制算法，机器学习算法对机器人进行全身控制；和上下游团队进行深入合作和共同探，深⼊探索未知⼯程和技术领域，影响并参与决策；

更新于 2025-07-01深圳|北京|上海

人形机器人运动控制算法工程师

社招

更新于 2025-03-26深圳|上海|北京