logo of antgroup

蚂蚁金服蚂蚁集团-蚂蚁技术研究院-大规模强化学习算法与系统研究员

社招全职3年以上技术类-算法地点:杭州状态:招聘

任职要求


1. 硕士以上学历,博士优先
2. 在分布式系统领域或者并行计算领域有3年以上研究和实践经验
3. 有独立研究能力,在…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


强化学习是提升大模型推理能力的重要范式。大模型本身参数量大,训练资源消耗高,加上强化学习算法流程复杂,要开发灵活又高效的强化学习系统有诸多挑战,而大规模强化学习基础设施又是开展强化学习算法研究的基础,目前需要以下方向的研究:
1. 高效灵活的面向大模型的强化学习训练系统:能够支持各种强化学习复杂算法,同时支持大规模多卡高效率稳定训练。
2. 复杂强化学习算法在大规模计算下的并行化:强化学习算法普遍需要串行计算,对于规模化(scale up)大规模训练带来诸多挑战,而规模化又是推理能力提升的关键,因此需要研究在规模化前提下的强化学习算法。

在本岗位,你将参与或主导相关领域的研究,并产出有影响力的成果并赋能业务部门。
包括英文材料
学历+
分布式系统+
深度学习+
还有更多 •••
相关职位

logo of antgroup
社招3年以上技术-研究

围绕AReaL系统,开展面向大模型及通用Agent的大规模强化学习算法的前沿研究。围绕算法工程一体化设计,复杂agent链路搭建,大规模自动化面向智能体的数据合成与清洗,以工程驱动算法进展,最终产出sota的开源推理/agent模型

更新于 2025-09-04北京|上海|杭州
logo of antgroup
社招技术类-开发

1. 营销阵地C端玩法架构设计与实现,在快速迭代中沉淀抽象以提升研发效率 2. 电商导购心智产品建设与迭代,用数据、技术驱动业务效果提升 3. 支撑大促活动,解决高并发高难度技术课题,协同上下游落地跨团队项目,并保障项目稳定 4. 推荐系统迭代与调优,构建多维度策略能力,提升整体推荐分发效率与效果

更新于 2025-07-21杭州
logo of antgroup
社招2年以上技术类-开发

方向一: 客户端平台:iOS/Android 方向二: 1.客户端基础框架的定制、开发、优化。 2.Web技术研发,移动端跨端动态技术研发,包括生态语言、渲染技术 方向三: 1.面向支付宝客户端iOS/Android平台的智能化基础设施建设,赋能端内各业务场景; 2.负责端侧计算引擎的架构设计与开发,增强对用户的理解; 3.负责端云共享学习、在线学习等领域的技术体系建设; 4.负责终端大模型框架与应用落地 5.强烈责任心和团队合作精神,乐于探索未知领域。

更新于 2025-04-03北京|上海|杭州
logo of antgroup
社招3年以上技术类-数据

1、与业务需求结合,设计并落地创新型实验及准实验,提升实验的效率和洞察深度,探索机器学习技术、动线挖掘、模型预测等方法在因果推断中的应用场景,解决观测数据中因果关系的识别,研发新型因果推断方法,优化业务决策; 2、从理解业务问题到因果因推断相关领域方法论研究、原型验证、直到与工程团队合作将成熟的技术产品化,推动方法从理论到实践的转化。设计可扩展的实验框架,支持大规模、多场景下的因果推算与效果评估; 3、负责通过AB实验设计、因果推断、深度学习等手段,量化运营策略效果和价值,科学评估运营手段,为业务决策提效。

更新于 2025-07-28北京