蚂蚁金服蚂蚁集团-蚂蚁技术研究院-大规模强化学习算法与系统研究员
社招全职3年以上技术类-算法地点:杭州状态:招聘
任职要求
1. 硕士以上学历,博士优先 2. 在分布式系统领域或者并行计算领域有3年以上研究和实践经验 3. 有独立研究能力,在…
登录查看完整任职要求
微信扫码,1秒登录
工作职责
强化学习是提升大模型推理能力的重要范式。大模型本身参数量大,训练资源消耗高,加上强化学习算法流程复杂,要开发灵活又高效的强化学习系统有诸多挑战,而大规模强化学习基础设施又是开展强化学习算法研究的基础,目前需要以下方向的研究: 1. 高效灵活的面向大模型的强化学习训练系统:能够支持各种强化学习复杂算法,同时支持大规模多卡高效率稳定训练。 2. 复杂强化学习算法在大规模计算下的并行化:强化学习算法普遍需要串行计算,对于规模化(scale up)大规模训练带来诸多挑战,而规模化又是推理能力提升的关键,因此需要研究在规模化前提下的强化学习算法。 在本岗位,你将参与或主导相关领域的研究,并产出有影响力的成果并赋能业务部门。
包括英文材料
学历+
分布式系统+
https://www.distributedsystemscourse.com/
The home page of a free online class in distributed systems.
https://www.youtube.com/watch?v=7VbL89mKK3M&list=PLOE1GTZ5ouRPbpTnrZ3Wqjamfwn_Q5Y9A
深度学习+
https://d2l.ai/
Interactive deep learning book with code, math, and discussions.
还有更多 •••
相关职位
社招3年以上技术-研究
围绕AReaL系统,开展面向大模型及通用Agent的大规模强化学习算法的前沿研究。围绕算法工程一体化设计,复杂agent链路搭建,大规模自动化面向智能体的数据合成与清洗,以工程驱动算法进展,最终产出sota的开源推理/agent模型
更新于 2025-09-04北京|上海|杭州
社招技术类-开发
1. 营销阵地C端玩法架构设计与实现,在快速迭代中沉淀抽象以提升研发效率 2. 电商导购心智产品建设与迭代,用数据、技术驱动业务效果提升 3. 支撑大促活动,解决高并发高难度技术课题,协同上下游落地跨团队项目,并保障项目稳定 4. 推荐系统迭代与调优,构建多维度策略能力,提升整体推荐分发效率与效果
更新于 2025-07-21杭州
社招2年以上技术类-开发
方向一: 客户端平台:iOS/Android 方向二: 1.客户端基础框架的定制、开发、优化。 2.Web技术研发,移动端跨端动态技术研发,包括生态语言、渲染技术 方向三: 1.面向支付宝客户端iOS/Android平台的智能化基础设施建设,赋能端内各业务场景; 2.负责端侧计算引擎的架构设计与开发,增强对用户的理解; 3.负责端云共享学习、在线学习等领域的技术体系建设; 4.负责终端大模型框架与应用落地 5.强烈责任心和团队合作精神,乐于探索未知领域。
更新于 2025-04-03北京|上海|杭州