logo of xpeng

小鹏汽车强化学习算法工程师(人形机器人运动控制方向)

社招全职地点:深圳 | 上海状态:招聘

任职要求


1. 硕士及以上学历,自动化、计算机、人工智能等专业;
2. 扎实的机器学习理论功底和编程能力;
3. 熟悉主流深度学习、强化学习训练框架,熟悉issac …
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1. 研发基于强化学习的人形机器人全身运动控制算法;
2. 搭建强化学习运动控制算法完整训练流程并优化性能;
3. 分析评估算法性能,迭代优化控制策略;
4. 与团队协作,推动强化学习算法部署调试测试;
5. 跟进人形机器人全身运动控制算法,为团队引入新思路,保持技术领先性。
包括英文材料
学历+
机器学习+
还有更多 •••
相关职位

logo of honor
社招1年以上研发类

1、负责基于强化学习/模仿学习的双足运动控制算法的研发和调试,或负责具身智能双臂操作算法的研发和调试,确保算法的高效性和稳定性; 2、在真实机器人平台上进行训练模型的部署与调试,深入分析并解决sim2real GAP问题,确保模拟环境与真实环境之间的有效转化; 3、跟踪前沿机器人双足和双臂规划控制的研究方向,参与相关算法的验证与评估,推动技术的持续创新与应用; 4、开发机械臂底层运控算法 ,设计并实现轨迹优化、碰撞检测等核心算法,确保机器人能够高效、准确地完成复杂场景下的任务; 5、跨团队协作:与感知、硬件等相关团队紧密合作,参与机器人系统的级联调试与问题攻关,推动技术闭环的落地实施,确保项目的顺利推进。

更新于 2025-02-25北京|上海|深圳
logo of xpeng
社招

1. 基于Isaac Gym/MuJoCo搭建高保真仿真环境,优化人形机器人运动控制RL训练的并行效率与物理精度; 2. 开发3DGS/NeRF等动态场景渲染管线,支持视觉-动力学联合仿真(sim2real迁移); 3. 构建生成式世界模型驱动的仿真系统,实现动态场景自动生成与自适应难度调控; 4. 设计分布式仿真架构,支持万级机器人实例的实时交互与数据采集。

更新于 2025-04-28上海|深圳
logo of xpeng
校招

1. 研发基于强化学习的人形机器人全身运动控制算法; 2. 搭建强化学习运动控制算法完整训练流程并优化性能; 3. 分析评估算法性能,迭代优化控制策略; 4. 与团队协作,推动强化学习算法部署调试测试; 5. 跟进人形机器人全身运动控制算法,为团队引入新思路,保持技术领先性。

更新于 2025-04-28深圳
logo of xpeng
社招3年以上

我们致力于推动强化学习(Reinforcement Learning, RL)在人形机器人运动控制、大语言模型推理优化、和具身智能体(Embodied AI) 领域的突破性应用。现招募具备深厚RL技术背景的算法工程师,参与从算法设计、仿真训练到真实场景部署的全链路研发,探索AI与物理世界的深度融合。 1. 研究大语言模型RLHF阶段的广义强化算法,提升大模型的能力,探索大模型的自我进化之路; 2. 研究大模型驱动的智能体算法,包括但是不局限于ReACT、Voyager、WebGPT、AutoGPT; 3. 撰写技术报告和论文,分享研究成果,参与内外部的技术交流和合作,推动团队技术水平的提升,提高团队在行业内的影响力。

更新于 2025-03-04上海|深圳