
竞技世界【竞技世界】游戏AI强化学习算法工程师
1、研究并应用强化学习(RL)技术在游戏场景中的创新应用,如 NPC 行为学习、自适应游戏策略、自动化测试等; 2、负责开发基于 RL 的智能体决策、路径规划、多智能体协作等算法; 3、结合 LLM、计算机视觉等技术,提升游戏 AI 的决策能力和可玩性; 4、负责强化学习模型的训练、优化和部署,提升游戏 AI 的自主学习能力; 5、跟踪强化学习在游戏领域的最新研究,并结合游戏项目进行创新探索; 6、 持续改进算法和框架,开发和完善通用框架和SDK工具,提升游戏AI开发效率。
1、研究并应用强化学习(RL)技术在游戏场景中的创新应用,如 NPC 行为学习、自适应游戏策略、自动化测试等; 2、负责开发基于 RL 的智能体决策、路径规划、多智能体协作等算法; 3、结合 LLM、计算机视觉等技术,提升游戏 AI 的决策能力和可玩性; 4、负责强化学习模型的训练、优化和部署,提升游戏 AI 的自主学习能力; 5、跟踪强化学习在游戏领域的最新研究,并结合游戏项目进行创新探索; 6、 持续改进算法和框架,开发和完善通用框架和SDK工具,提升游戏AI开发效率。
我们正在寻找在分布式强化学习领域具有深厚技术背景的工程师,负责设计和实现大规模分布式强化学习系统。您将参与前沿AI技术的研发,推动强化学习在实际业务场景中的落地应用,包括但不限于自动驾驶、机器人控制、大模型训练等领域。 1. 设计和实现先进的分布式强化学习算法(PPO、SAC、IMPALA、Ape-X等); 2. 研究多智能体强化学习(MARL)算法和协调机制; 3. 优化采样效率和训练稳定性,解决稀疏奖励和探索难题; 4. 跟踪学术前沿,将最新研究成果转化为工程实现; 5. 设计高性能分布式训练架构,支持千核级别的并行训练; 6. 实现异步参数更新、经验回放和梯度聚合机制; 7. 优化通信拓扑和数据流,降低网络延迟和带宽消耗; 8. 构建弹性可扩展的训练集群,支持动态资源调度。