logo of antgroup

蚂蚁金服蚂蚁集团-AReaL强化学习框架研发工程师-北京/杭州

社招全职3年以上技术类-开发地点:北京 | 杭州状态:招聘

任职要求


1. 具备大模型训练框架或分布式推理框架开发经验。熟悉 Megatron-LM、DeepSpeed 等分布式训练框架,或具备 SGLang、vLLM 等大模型分布式推理与推理加速框架开发经验者优先;
2. 具备良好的逻辑分析能力,对复杂框架的模块设计、抽象边界和工程实现有一定理解;具备规范的代码提交习惯,熟悉 GitH…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


负责 AReaL 开源框架的开发、迭代和生态建设。
1. 负责将 Agent 开发工具集成到 AReaL 框架中,打通外部工具调用与内部训练体系之间的链路,支持 Agent工具在强化学习训练流程中的使用;
2. 参与 AReaL 开源框架的开发与维护,在 GitHub 上推进开源版本迭代,包括功能开发、文档编写、用户反馈的响应;
3. 负责主流 AI 模型在 AReaL 框架上的适配工作,包括模型迁移、训练与推理环境配置、运行链路打通,确保模型能够在 AReaL 中稳定、高效运行;
4. 系统性能优化:针对大模型强化学习训练和推理场景,进行端到端性能分析和优化,包括分布式训练加速、显存优化、通信效率提升等,满足大规模 Agent 训练的性能要求。
包括英文材料
大模型+
Megatron+
DeepSpeed+
SGLang+
还有更多 •••