蚂蚁金服【蚂蚁星-Plan A】算法工程师-智能体 (强化学习方向)
校招全职2026届蚂蚁星- Plan A人才计划地点:北京 | 上海 | 杭州状态:招聘
任职要求
有人工智能和大模型相关开发和研究经历,发表过顶级…登录查看完整任职要求
微信扫码,1秒登录
工作职责
AReaL团队聚焦强化学习技术,结合大模型泛化能力,研发开源开放的决策模型和强化学习训练系统,并应用于通用智能体模型和产品。 1. AReaL团队聚焦强化学习技术,结合大模型泛化能力,研发开源开放的决策模型和强化学习训练系统,并应用于智能体方向; 2. 参与蚂蚁自研强化学习推理模型的算法和训练系统研发。
包括英文材料
大模型+
https://www.youtube.com/watch?v=xZDB1naRUlk
You will build projects with LLMs that will enable you to create dynamic interfaces, interact with vast amounts of text data, and even empower LLMs with the capability to browse the internet for research papers.
https://www.youtube.com/watch?v=zjkBMFhNj_g
相关职位
社招技术类-开发
1. 营销阵地C端玩法架构设计与实现,在快速迭代中沉淀抽象以提升研发效率 2. 电商导购心智产品建设与迭代,用数据、技术驱动业务效果提升 3. 支撑大促活动,解决高并发高难度技术课题,协同上下游落地跨团队项目,并保障项目稳定 4. 推荐系统迭代与调优,构建多维度策略能力,提升整体推荐分发效率与效果
更新于 2025-07-21杭州
社招2年以上技术类-开发
方向一: 客户端平台:iOS/Android 方向二: 1.客户端基础框架的定制、开发、优化。 2.Web技术研发,移动端跨端动态技术研发,包括生态语言、渲染技术 方向三: 1.面向支付宝客户端iOS/Android平台的智能化基础设施建设,赋能端内各业务场景; 2.负责端侧计算引擎的架构设计与开发,增强对用户的理解; 3.负责端云共享学习、在线学习等领域的技术体系建设; 4.负责终端大模型框架与应用落地 5.强烈责任心和团队合作精神,乐于探索未知领域。
更新于 2025-04-03北京|上海|杭州
社招3年以上技术类-数据
1、与业务需求结合,设计并落地创新型实验及准实验,提升实验的效率和洞察深度,探索机器学习技术、动线挖掘、模型预测等方法在因果推断中的应用场景,解决观测数据中因果关系的识别,研发新型因果推断方法,优化业务决策; 2、从理解业务问题到因果因推断相关领域方法论研究、原型验证、直到与工程团队合作将成熟的技术产品化,推动方法从理论到实践的转化。设计可扩展的实验框架,支持大规模、多场景下的因果推算与效果评估; 3、负责通过AB实验设计、因果推断、深度学习等手段,量化运营策略效果和价值,科学评估运营手段,为业务决策提效。
更新于 2025-07-28北京