logo of xpeng

小鹏汽车【26届校招】强化学习算法工程师

校招全职地点:北京 | 广州状态:招聘

任职要求


1.2026 届应届毕业生,计算机科学、人工智能、机器人等相关专业硕士及以上学历。
2.具备扎实的强化学习理论基础,熟悉常见的深度学习算法强化学习算法。
3.有一定的编程能力,熟练掌握 PythonC++ 等编程语言。
4.具备良好的数学基础,包括线性代数、概率论、统计学等。
5.有较强的学习能力和创新精神,对自动驾驶技术有浓厚的兴趣和热情。
6.具备良好的团队合作精神和沟通能力,乐于分享,有较强的沟通能力。

工作职责


1.参与端到端模型的多阶段大规模预训练及FT后训练(包含RL),参与并探索自动驾驶领域的Scaling Law。
2.负责设计、优化、迭代RL系统Reward、Objective及环境建模框架,参与自动驾驶各种场景下的Self Play式模型强化训练。
3.分析并优化自动驾驶相关的OnPolicy/OffPolicy及Synthetic数据集,构建高效的模型的闭环迭代训练评估流程。
包括英文材料
学历+
强化学习+
深度学习+
算法+
Python+
C+++
自动驾驶+
相关职位

logo of xpeng
校招

1.研发业界一流物理AI系统,包括不限于模仿学习, 强化学习, vla, vlm等训练系统与算法架构; 2.参与自动驾驶系统中机器学习算法的研究、开发与优化,包括但不限于深度学习算法在端到端感知大模型、规控大模型、视觉语言大模型等方面的应用; 3.设计和实现机器学习模型的训练流程,包括选择合适的优化算法、调整超参数、评估模型性能等,确保模型在不同场景下的稳定性和可靠性。

更新于 2025-07-01
logo of xpeng
校招

1.参与自动驾驶系统中机器学习算法的研究、开发与优化,包括但不限于深度学习算法在端到端感知大模型、规控大模型、视觉语言大模型等方面的应用; 2.负责收集、整理和分析自动驾驶相关的数据集,进行数据预处理和标注,以提高模型的准确性和泛化能力; 3.设计和实现机器学习模型的训练流程,包括选择合适的优化算法、调整超参数、评估模型性能等,确保模型在不同场景下的稳定性和可靠性。

更新于 2025-06-22
logo of xpeng
校招

【关于我们】 小鹏机器人中心致力于研发先进的人形机器人技术,包括机器人的行走、操作、智能导航,以及在大语言模型支持下的人机交互等。我们的软硬件团队覆盖深圳、上海、广州、北京和北美,组成了一支世界一流的跨领域团队。作为本团队的一员,你将成为连接人工智能与物理世界的桥梁,与其他领域的工程师共同解决前沿的科研和工程难题,并在机器人技术的发展中留下自己的印记。 负责人形机器人运动控制算法的研究与开发,包括人形机器人建模、协同规划/控制等; 应用先进的运动控制算法,机器学习算法对机器人进行全身控制; 和上下游团队进行深入合作和共同探,深⼊探索未知⼯程和技术领域,影响并参与决策;

更新于 2025-07-01
logo of xpeng
校招

1、参与自动驾驶系统中多模态大模型算法的研究、开发与优化,包括但不限于世界模型、端到端感知大模型、VLA大模型、多模态视觉语言大模型、离线数据算法大模型等方面的应用; 2、负责设计实现不同领域应用的多模态大模型架构,对模型进行迭代优化,以车端模型/数据产线模型量产为主要目标; 3、设计和实现多模态大模型的训练流程,包括选择合适的优化算法、调整超参数、评估模型性能等,确保模型在不同场景下的稳定性和可靠性; 4、针对多模态大模型模型进行车端/云端部署,能够让模型在大规模量产场景下高效运行,产生业务价值; 5、针对多模态大模型进行训练效率优化,实现训练提效。

更新于 2025-08-15