logo of alibaba

阿里巴巴智能引擎-大模型平台研发工程师-强化学习环境

社招全职3年以上技术-基础平台地点:北京 | 杭州状态:招聘

任职要求


1. 学习能力较强,愿意学习新东西,具有优秀的分析和解决实际问题的能力和态度,对技术有强烈激情。
2. 具有良好的编程和工程实现能力,精通Python算法数据结构基础扎实。
3. 有大规模分布式系统研发经验,熟悉Ray/K8S等分布式调度和计算框架者优先。
4. 符合以下条…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


通过技术创新支持阿里集团大模型研发快速迭代,主要工作内容和挑战如下:
1. 建设大规模强化学习的环境平台,增强大模型对齐Coding&Agentic等方面的能力。
2. 结合强化学习框架,优化强化学习效率,实现高效的大规模强化学习训练。
3. 建设覆盖各个领域场景的真实和仿真环境,支持大规模评测和Agentic后训练。
4. 将成熟的系统与算法成果发表于学术会议,并回馈开源社区(如 ROCK和ROLL等),持续提升在学术界与产业界的影响力。
包括英文材料
Python+
算法+
数据结构+
分布式系统+
还有更多 •••