小鹏汽车强化学习算法工程师

社招全职2025-04-28地点：深圳 | 上海状态：招聘

扫码手机上打开

任职要求

1. 硕士及以上学历，专业包括机器学习、人工智能、计算机科学、信息/多媒体检索、强化学习、数学等；
2. 具备Python、C++、Java或其他相关语言的开发经验；
3. 熟悉PyTorch、TensorFlow等深度学习框架；

加分项：
1. 具备超越简单模拟器的强化学习应用经验（如实际场景部署）；
2. 擅长通过定量方法解决分析性问题；
3. 具有处理和分析多源、高复杂度、高维度数据的经验；
4. 有基于机器学习、强化学习或深度学…

登录查看完整任职要求

微信扫码，1秒登录

工作职责

1. 开展机器学习和强化学习领域的科学研究，推动技术进步；
2. 开发更优的数据驱动人类行为建模方法；
3. 与研究人员及跨职能团队合作，沟通研究计划、进展与成果；
4. 应用前沿强化学习技术，推动生成式人工智能（GenAI）和具身智能应用落地。
5. 参与学术论文发表及开源项目贡献。

📮 投递简历 ✨AI模拟面试

难度：

包括英文材料

学历+

机器学习+

强化学习+

Python+

C+++

Java+

PyTorch+

还有更多 •••

登录查看完整学习资料

相关职位

强化学习算法工程师

社招1年以上网易伏羲

1、对接游戏项目需求，负责技术方案的设计和实现，不断迭代和优化项目效果； 2、持续改进算法和框架，开发和完善通用框架和SDK工具，提升游戏AI开发效率。

更新于 2025-06-16杭州

强化学习算法工程师

社招核心本地商业-业

1. 负责强化学习算法的研究、开发和应用，解决AI搜索等实际问题并提升业务效果。 2. 设计、实现、优化强化学习模型，包括但不限于价值迭代、策略梯度、模型预测控制等算法。 3. 跟踪强化学习领域的前沿研究进展，不断探索和创新，推动强化技术发展。 4. 与LLM的模型后训练相结合，迭代RL训练技术并实现业务模型的调优和落地。

更新于 2025-04-22北京|上海

强化学习算法工程师

社招A30179A

1、负责强化学习算法的开发和应用，用于机器人的精细操作或者全身运动控制，提升动作的自然度和鲁棒性； 2、完成控制策略在真机上的测试验证，重点解决部署过程中遇到的sim2real gap问题； 3、持续跟踪国内外前沿研究成果，并进行相关算法复现。

更新于 2025-05-06北京

强化学习算法工程师/专家

社招3-5年D12518

团队介绍：我们是kwaipilot团队，负责快手自研KAT大语言模型的训练及开发。快手KAT系列模型编码能力在多个相关benchmark上的效果位居全球top3。主要工作方向包括: 1、通过算法创新与系统工程，刷新Agent的能力边界，效果达到世界领先水平； 2、专注于大语言模型（LLM）的前沿技术研究与技术落地，包括但不限于RL，Agent等方向； 3、负责大规模训练的算法-基建联合优化。

更新于 2026-01-19北京