logo of jj

竞技世界【竞技世界】游戏AI强化学习算法工程师

社招全职AI部地点:北京状态:招聘

任职要求


1、了解基本的游戏AI项目开展流程,自学能力与动手能力强,具备一定的工程开发素养
2、对于深度学习强化学习或计算机博弈(博弈论、博弈对抗决策)等其中之一方向较为熟悉,有一定的研究基础或实际项目经历;
3、对于游戏AI方向抱有较大热情与耐心,具备一定的研究素养
4、具备多智能体学习、分布式强化学习等经验优先
5、有游戏AI相关项⽬经验者优先

工作职责


1、负责强化学习等AI算法在游戏应用场景的商业化落地,包括:游戏环境搭建、模型训练、强化学习框架开发、效果优化等,完成项目交付
2、跟踪了解前沿游戏AI技术研究现状与发展趋势,并推动前沿技术的落地应用
包括英文材料
深度学习+
强化学习+
智能体+
相关职位

logo of kuaishou
社招2年以上D8039

1、研究并应用强化学习(RL)技术在游戏场景中的创新应用,如 NPC 行为学习、自适应游戏策略、自动化测试等; 2、负责开发基于 RL 的智能体决策、路径规划、多智能体协作等算法; 3、结合 LLM、计算机视觉等技术,提升游戏 AI 的决策能力和可玩性; 4、负责强化学习模型的训练、优化和部署,提升游戏 AI 的自主学习能力; 5、跟踪强化学习在游戏领域的最新研究,并结合游戏项目进行创新探索; 6、 持续改进算法和框架,开发和完善通用框架和SDK工具,提升游戏AI开发效率。

更新于 2025-03-18
logo of kuaishou
社招3-5年D8039

1、研究并应用强化学习(RL)技术在游戏场景中的创新应用,如 NPC 行为学习、自适应游戏策略、自动化测试等; 2、负责开发基于 RL 的智能体决策、路径规划、多智能体协作等算法; 3、结合 LLM、计算机视觉等技术,提升游戏 AI 的决策能力和可玩性; 4、负责强化学习模型的训练、优化和部署,提升游戏 AI 的自主学习能力; 5、跟踪强化学习在游戏领域的最新研究,并结合游戏项目进行创新探索; 6、 持续改进算法和框架,开发和完善通用框架和SDK工具,提升游戏AI开发效率。

更新于 2025-08-05
logo of mihoyo
校招程序&技术类

1、负责游戏AI深度强化学习算法设计,提供解决方案等; 2、负责游戏AI前沿算法的研究和开发,包括特征工程,模型训练,效果优化,RL分布式框架等。

logo of xpeng
社招智能机器人板块

我们正在寻找在分布式强化学习领域具有深厚技术背景的工程师,负责设计和实现大规模分布式强化学习系统。您将参与前沿AI技术的研发,推动强化学习在实际业务场景中的落地应用,包括但不限于自动驾驶、机器人控制、大模型训练等领域。 1. 设计和实现先进的分布式强化学习算法(PPO、SAC、IMPALA、Ape-X等); 2. 研究多智能体强化学习(MARL)算法和协调机制; 3. 优化采样效率和训练稳定性,解决稀疏奖励和探索难题; 4. 跟踪学术前沿,将最新研究成果转化为工程实现; 5. 设计高性能分布式训练架构,支持千核级别的并行训练; 6. 实现异步参数更新、经验回放和梯度聚合机制; 7. 优化通信拓扑和数据流,降低网络延迟和带宽消耗; 8. 构建弹性可扩展的训练集群,支持动态资源调度。

更新于 2025-08-19