小鹏汽车【25届校招】强化学习算法工程师(人形机器人运动控制方向)
任职要求
1. 硕士及以上学历,自动化、计算机、人工智能等专业; 2. 扎实的机器学习理论功底和编程能力; 3. 熟悉主流深度学习、强化学习训练框架,熟悉issac gym/mujoco等仿真系统; 4. 有足式机器人系统(四足、人形机器人)运动控制相关项目经验者优先; 5. 分析问题和创新能力强,热爱机器人和人工智能。
工作职责
1. 研发基于强化学习的人形机器人全身运动控制算法; 2. 搭建强化学习运动控制算法完整训练流程并优化性能; 3. 分析评估算法性能,迭代优化控制策略; 4. 与团队协作,推动强化学习算法部署调试测试; 5. 跟进人形机器人全身运动控制算法,为团队引入新思路,保持技术领先性。
1. 开发通用型具身算法并应用于人形机器人场景任务,具备物体泛化、任务泛化、场景泛化能力; 2. 研究多模态具身大模型,具备视觉、触觉、语言感知和决策能力,控制机器人完成开放世界的物理交互;
我们致力于推动强化学习(Reinforcement Learning, RL)在人形机器人运动控制、大语言模型推理优化、和具身智能体(Embodied AI) 领域的突破性应用。现招募具备深厚RL技术背景的算法工程师,参与从算法设计、仿真训练到真实场景部署的全链路研发,探索AI与物理世界的深度融合。 1. 研究大语言模型RLHF阶段的广义强化算法,提升大模型的能力,探索大模型的自我进化之路; 2. 研究大模型驱动的智能体算法,包括但是不局限于ReACT、Voyager、WebGPT、AutoGPT; 3. 撰写技术报告和论文,分享研究成果,参与内外部的技术交流和合作,推动团队技术水平的提升,提高团队在行业内的影响力。
【关于我们】 小鹏机器人中心致力于研发先进的人形机器人技术,包括机器人的行走、操作、智能导航,以及在大语言模型支持下的人机交互等。我们的软硬件团队覆盖深圳、上海、广州、北京和北美,组成了一支世界一流的跨领域团队。作为本团队的一员,你将成为连接人工智能与物理世界的桥梁,与其他领域的工程师共同解决前沿的科研和工程难题,并在机器人技术的发展中留下自己的印记。 - 开发和改进机器学习和视觉算法,以支持机器人的空间感知、导航、操作、交互等功能。 - 应用各种最新的机器学习算法,包括端到端模仿学习、强化学习、大语言模型,推动人形机器人的发展。 - 开发使机器人从其与物理世界的交互中学习与进化的算法。 - 对算法涉及的数据、训练优化和部署环境等环节有深刻认知,并领导或参与跨团队合作。 - 深⼊探索未知⼯程和技术领域,影响并参与决策。