logo of xpeng

小鹏汽车分布式强化学习算法工程师

社招全职智能机器人板块地点:深圳 | 上海状态:招聘

任职要求


职位要求:
1. 有大规模分布式训练系统开发经验(Ray、Horovod、Parameter Server等);
2. 熟悉多智能体强化学习、层次强化学习、元学习等前沿方向;
3. 有GPU集群管理和优化经验,了解CUDA编程;
4. 发表过强化学习相关的顶级会议论文(ICMLNeurIPSICLR等);
5. 有实际RL项目落地经验(游戏AI、机器人、自动驾驶等);
6. 熟悉KubernetesDocker等容器化技术。

工作职责


我们正在寻找在分布式强化学习领域具有深厚技术背景的工程师,负责设计和实现大规模分布式强化学习系统。您将参与前沿AI技术的研发,推动强化学习在实际业务场景中的落地应用,包括但不限于自动驾驶、机器人控制、大模型训练等领域。

1. 设计和实现先进的分布式强化学习算法(PPO、SAC、IMPALA、Ape-X等);
2. 研究多智能体强化学习(MARL)算法和协调机制;
3. 优化采样效率和训练稳定性,解决稀疏奖励和探索难题;
4. 跟踪学术前沿,将最新研究成果转化为工程实现;
5. 设计高性能分布式训练架构,支持千核级别的并行训练;
6. 实现异步参数更新、经验回放和梯度聚合机制;
7. 优化通信拓扑和数据流,降低网络延迟和带宽消耗;
8. 构建弹性可扩展的训练集群,支持动态资源调度。
包括英文材料
Ray+
智能体+
强化学习+
CUDA+
ICML+
NeurIPS+
自动驾驶+
Kubernetes+
Docker+
相关职位

logo of jj
社招AI部

1、负责强化学习等AI算法在游戏应用场景的商业化落地,包括:游戏环境搭建、模型训练、强化学习框架开发、效果优化等,完成项目交付 2、跟踪了解前沿游戏AI技术研究现状与发展趋势,并推动前沿技术的落地应用

更新于 2025-10-16
logo of leyuansu
校招

1、负责强化学习相关技术在休闲游戏中自动打关及关卡难度调节的落地应用; 2、参与强化学习算法实现及框架搭建,探索强化学习在游戏生命周期各个阶段的应用方向; 3、参与深度学习基础平台的功能选代,持续研发算法与优化性能; 4、跟踪分析工业界及学术界相关方向最新进展。

logo of duole
校招

1、利用监督学习和强化学习等技术,研发以机器学习为基础的棋牌游戏AI。 2、主导算法模型的建立和开发,包括但不限于特征提取、奖励设计、模型训练、神经网络结构优化、参数调优等。 3、基于大量的游戏数据,深入理解和分析玩家数据,制定智能化的数值策略,以提高玩家的活跃度和付费能力。

logo of jj
校招技术类

负责深度学习、强化学习等AI算法在游戏应用场景的商业化落地 包括:游戏环境搭建、模型训练、强化学习框架开发、效果优化等,完成项目交付

更新于 2024-10-30