小鹏汽车【26届校招】强化学习算法工程师

校招全职2025-07-01地点：北京 | 广州状态：招聘

扫码手机上打开

任职要求

1.2026 届应届毕业生，计算机科学、人工智能、机器人等相关专业硕士及以上学历。
2.具备扎实的强化学习理论基础，熟悉常见的深度学习算法及强化学习算法。
3.有一定的编程能力，熟练掌握 Python、C++…

登录查看完整任职要求

微信扫码，1秒登录

工作职责

1.参与端到端模型的多阶段大规模预训练及FT后训练（包含RL），参与并探索自动驾驶领域的Scaling Law。
2.负责设计、优化、迭代RL系统Reward、Objective及环境建模框架，参与自动驾驶各种场景下的Self Play式模型强化训练。
3.分析并优化自动驾驶相关的OnPolicy/OffPolicy及Synthetic数据集，构建高效的模型的闭环迭代训练评估流程。

📮 投递简历 ✨AI模拟面试

难度：

包括英文材料

学历+

强化学习+

深度学习+

还有更多 •••

登录查看完整学习资料

相关职位

【26届校招】大模型算法工程师

校招

1.研发业界一流物理AI系统，包括不限于模仿学习，强化学习， vla， vlm等训练系统与算法架构； 2.参与自动驾驶系统中机器学习算法的研究、开发与优化，包括但不限于深度学习算法在端到端感知大模型、规控大模型、视觉语言大模型等方面的应用； 3.设计和实现机器学习模型的训练流程，包括选择合适的优化算法、调整超参数、评估模型性能等，确保模型在不同场景下的稳定性和可靠性。

更新于 2025-07-01北京

【26届校招】大模型算法工程师

校招

1.参与自动驾驶系统中机器学习算法的研究、开发与优化，包括但不限于深度学习算法在端到端感知大模型、规控大模型、视觉语言大模型等方面的应用； 2.负责收集、整理和分析自动驾驶相关的数据集，进行数据预处理和标注，以提高模型的准确性和泛化能力； 3.设计和实现机器学习模型的训练流程，包括选择合适的优化算法、调整超参数、评估模型性能等，确保模型在不同场景下的稳定性和可靠性。

更新于 2025-06-22北京|上海

【26届校招】人形机器人运动控制算法工程师

校招

【关于我们】小鹏机器人中心致力于研发先进的人形机器人技术，包括机器人的行走、操作、智能导航，以及在大语言模型支持下的人机交互等。我们的软硬件团队覆盖深圳、上海、广州、北京和北美，组成了一支世界一流的跨领域团队。作为本团队的一员，你将成为连接人工智能与物理世界的桥梁，与其他领域的工程师共同解决前沿的科研和工程难题，并在机器人技术的发展中留下自己的印记。负责人形机器人运动控制算法的研究与开发，包括人形机器人建模、协同规划/控制等；应用先进的运动控制算法，机器学习算法对机器人进行全身控制；和上下游团队进行深入合作和共同探，深⼊探索未知⼯程和技术领域，影响并参与决策；

更新于 2025-07-01深圳|北京|上海

【26届校招】世界模型及环境感知算法工程师

校招

1、参与自动驾驶系统中多模态大模型算法的研究、开发与优化，包括但不限于世界模型、端到端感知大模型、VLA大模型、多模态视觉语言大模型、离线数据算法大模型等方面的应用； 2、负责设计实现不同领域应用的多模态大模型架构，对模型进行迭代优化，以车端模型/数据产线模型量产为主要目标； 3、设计和实现多模态大模型的训练流程，包括选择合适的优化算法、调整超参数、评估模型性能等，确保模型在不同场景下的稳定性和可靠性； 4、针对多模态大模型模型进行车端/云端部署，能够让模型在大规模量产场景下高效运行，产生业务价值； 5、针对多模态大模型进行训练效率优化，实现训练提效。

更新于 2025-08-15广州|北京|深圳