蚂蚁金服蚂蚁集团-蚂蚁技术研究院-大规模强化学习算法与系统研究员

社招全职3年以上技术类-算法2025-06-18地点：杭州状态：招聘

扫码手机上打开

任职要求

1. 硕士以上学历，博士优先
2. 在分布式系统领域或者并行计算领域有3年以上研究和实践经验
3. 有独立研究能力，在…

登录查看完整任职要求

微信扫码，1秒登录

工作职责

强化学习是提升大模型推理能力的重要范式。大模型本身参数量大，训练资源消耗高，加上强化学习算法流程复杂，要开发灵活又高效的强化学习系统有诸多挑战，而大规模强化学习基础设施又是开展强化学习算法研究的基础，目前需要以下方向的研究：
1. 高效灵活的面向大模型的强化学习训练系统：能够支持各种强化学习复杂算法，同时支持大规模多卡高效率稳定训练。
2. 复杂强化学习算法在大规模计算下的并行化：强化学习算法普遍需要串行计算，对于规模化（scale up）大规模训练带来诸多挑战，而规模化又是推理能力提升的关键，因此需要研究在规模化前提下的强化学习算法。

在本岗位，你将参与或主导相关领域的研究，并产出有影响力的成果并赋能业务部门。

📮 投递简历 ✨AI模拟面试

难度：

包括英文材料

学历+

分布式系统+

深度学习+

还有更多 •••

登录查看完整学习资料

相关职位

蚂蚁集团-蚂蚁技术研究院-强化学习研究员

社招3年以上技术-研究

围绕AReaL系统，开展面向大模型及通用Agent的大规模强化学习算法的前沿研究。围绕算法工程一体化设计，复杂agent链路搭建，大规模自动化面向智能体的数据合成与清洗，以工程驱动算法进展，最终产出sota的开源推理/agent模型

更新于 2025-09-04北京|上海|杭州

蚂蚁集团-蚂蚁技术研究院-LLM系统研究员

社招3年以上技术-研究

"我们团队将致力于探索新型LLM架构的训练与推理加速技术，推动模型结构与算法层面的创新，全面提升LLM的效率与性能。 1. 研发Diffusion LLM的高效训练与推理框架，实现其推理性能1000倍的提升，突破现有扩散模型在语言生成中的效率瓶颈 2. 和LLM算法研究员合作，通过算法和系统的co-design，加速现有LLM的训练和推理 3. 针对新型LLM优化关键算子与分布式并行计算策略，显著降低其训练与推理成本 4. 开发面向LLM算子与并行计算的自动化优化框架，为算法研究人员提供一站式的自动优化解决方案，显著提升模型结构的开发效率与系统性能。"

更新于 2025-09-05北京|上海|杭州

蚂蚁集团-蚂蚁技术研究院-LLM系统工程师

社招3年以上技术-研究

我们团队将致力于探索新型LLM架构的训练与推理加速技术，推动模型结构与算法层面的创新，全面提升LLM的效率与性能。 1. 研发Diffusion LLM的高效训练与推理框架，实现其推理性能1000倍的提升，突破现有扩散模型在语言生成中的效率瓶颈 2. 和LLM算法研究员合作，通过算法和系统的co-design，加速现有LLM的训练和推理 3. 针对新型LLM优化关键算子与分布式并行计算策略，显著降低其训练与推理成本 4. 开发面向LLM算子与并行计算的自动化优化框架，为算法研究人员提供一站式的自动优化解决方案，显著提升模型结构的开发效率与系统性能。

更新于 2025-12-17北京|上海|杭州

蚂蚁集团-JAVA技术专家（实物电商）-支付宝技术

社招技术类-开发

1. 营销阵地C端玩法架构设计与实现，在快速迭代中沉淀抽象以提升研发效率 2. 电商导购心智产品建设与迭代，用数据、技术驱动业务效果提升 3. 支撑大促活动，解决高并发高难度技术课题，协同上下游落地跨团队项目，并保障项目稳定 4. 推荐系统迭代与调优，构建多维度策略能力，提升整体推荐分发效率与效果

更新于 2025-07-21杭州