logo of didi

滴滴强化学习资深工程师(JR2026061700G)

社招全职1-3年技术状态:招聘

任职要求


1. 硕士及以上学历,计算机科学、人工智能、机器学习、数据科学或应用数学等相关专业,1-3年相关工作经验;
2. 具有强化学习算法在实际业务场景中的应用经验,有大规模机器学习/深度学习项目经验,熟悉常见的强化学习算法(如PPO,GRPO,DAPO, GSPO)等;
3. 了解常用的强化学…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1. 负责强化学习算法在业务场景中的研究与应用,设计和实现高效的强化学习模型,解决业务中的复杂策略问题;
2. 持续优化算法性能,提升业务指标,跟踪业界最新技术进展,将前沿算法应用到实际业务中;
3. 解决强化学习理论与实际业务场景有效结合的挑战,处理大规模数据和高维状态空间的技术难题;
4. 在复杂多变的业务环境中保持算法的稳定性和适应性,平衡算法复杂度与工程实现的可行性。
包括英文材料