小鹏汽车【25届校招】强化学习算法工程师
任职要求
1. 硕士及以上学历,专业包括机器学习、人工智能、计算机科学、信息/多媒体检索、强化学习、数学等; 2. 具备Python、C++、Java或其他相关语言的开发经验; 3. 熟悉PyTorch、TensorFlow等深度学习框架; 加分项: 1. 具备超越简单模拟器的强化学习应用经验(如实际场景部署); 2. 擅长通过定量方法解决分析性问题; 3. 具有处理和分析多源、高复杂度、高维度数据的经验; 4. 有基于机器学习、强化学习或深度学习的系统开发经验; 5. 在学术或工业界取得显著成果的证明(如科研基金、奖学金、专利,或在NeurIPS、ICLR、AAAI、RecSys、KDD、IJCAI、CVPR、ECCV、ACL、NAACL、EACL、ICASSP等顶级会议/期刊以第一作者发表论文); 6. 通过实习、工作经验、编程竞赛或开源项目展示研究能力与工程实践能力; 7. 具备团队协作与跨职能沟通经验; 8. 善于解决复杂问题,能权衡不同解决方案的优劣与视角,制定推进路径。
工作职责
1. 开展机器学习和强化学习领域的科学研究,推动技术进步; 2. 开发更优的数据驱动人类行为建模方法; 3. 与研究人员及跨职能团队合作,沟通研究计划、进展与成果; 4. 应用前沿强化学习技术,推动生成式人工智能(GenAI)和具身智能应用落地。 5. 参与学术论文发表及开源项目贡献。
1. 研发基于强化学习的人形机器人全身运动控制算法; 2. 搭建强化学习运动控制算法完整训练流程并优化性能; 3. 分析评估算法性能,迭代优化控制策略; 4. 与团队协作,推动强化学习算法部署调试测试; 5. 跟进人形机器人全身运动控制算法,为团队引入新思路,保持技术领先性。
我们致力于推动强化学习(Reinforcement Learning, RL)在人形机器人运动控制、大语言模型推理优化、和具身智能体(Embodied AI) 领域的突破性应用。现招募具备深厚RL技术背景的算法工程师,参与从算法设计、仿真训练到真实场景部署的全链路研发,探索AI与物理世界的深度融合。 1. 研究大语言模型RLHF阶段的广义强化算法,提升大模型的能力,探索大模型的自我进化之路; 2. 研究大模型驱动的智能体算法,包括但是不局限于ReACT、Voyager、WebGPT、AutoGPT; 3. 撰写技术报告和论文,分享研究成果,参与内外部的技术交流和合作,推动团队技术水平的提升,提高团队在行业内的影响力。
【关于我们】 小鹏机器人中心致力于研发先进的人形机器人技术,包括机器人的行走、操作、智能导航,以及在大语言模型支持下的人机交互等。我们的软硬件团队覆盖深圳、上海、广州、北京和北美,组成了一支世界一流的跨领域团队。作为本团队的一员,你将成为连接人工智能与物理世界的桥梁,与其他领域的工程师共同解决前沿的科研和工程难题,并在机器人技术的发展中留下自己的印记。 - 开发和改进机器学习和视觉算法,以支持机器人的空间感知、导航、操作、交互等功能。 - 应用各种最新的机器学习算法,包括端到端模仿学习、强化学习、大语言模型,推动人形机器人的发展。 - 开发使机器人从其与物理世界的交互中学习与进化的算法。 - 对算法涉及的数据、训练优化和部署环境等环节有深刻认知,并领导或参与跨团队合作。 - 深⼊探索未知⼯程和技术领域,影响并参与决策。