小鹏汽车分布式强化学习算法工程师

社招全职智能机器人板块2025-08-19地点：深圳 | 上海状态：招聘

扫码手机上打开

任职要求

职位要求：
1. 有大规模分布式训练系统开发经验（Ray、Horovod、Parameter Server等）；
2. 熟悉多智能体强化学习、层次强化学习、元学习等前沿方向；
3. 有GPU集群管理和优化经验，了解C…

登录查看完整任职要求

微信扫码，1秒登录

工作职责

我们正在寻找在分布式强化学习领域具有深厚技术背景的工程师，负责设计和实现大规模分布式强化学习系统。您将参与前沿AI技术的研发，推动强化学习在实际业务场景中的落地应用，包括但不限于自动驾驶、机器人控制、大模型训练等领域。

1. 设计和实现先进的分布式强化学习算法（PPO、SAC、IMPALA、Ape-X等）；
2. 研究多智能体强化学习（MARL）算法和协调机制；
3. 优化采样效率和训练稳定性，解决稀疏奖励和探索难题；
4. 跟踪学术前沿，将最新研究成果转化为工程实现；
5. 设计高性能分布式训练架构，支持千核级别的并行训练；
6. 实现异步参数更新、经验回放和梯度聚合机制；
7. 优化通信拓扑和数据流，降低网络延迟和带宽消耗；
8. 构建弹性可扩展的训练集群，支持动态资源调度。

📮 投递简历 ✨AI模拟面试

难度：

包括英文材料

Ray+