蚂蚁金服【蚂蚁星-Plan A】算法工程师-后训练
校招全职蚂蚁星计划 - Plan A地点:北京 | 上海 | 杭州状态:招聘
任职要求
1. 计算机科学、人工智能、数学等相关专业硕士及以上学历,深入理解 Transformer 架构及SFT/RLHF/DPO/PPO/GRPO等算法。 2. 编码能力: 1)熟练掌握 Python 和 PyTorch,具备分布式训练(如多机多卡调优)经验,高性能计算代码开发经验(如CUDA编程、SIMD指令优化)更佳; 2)深入理解算法与数据结构,能针对LLM场景优化核心算法(如Attention计算、KV Cache管理)的时空复杂度; 3)熟悉代码…
登录查看完整任职要求
微信扫码,1秒登录
工作职责
作为蚂蚁集团的核心大模型部门,我们专注大语言模型的技术攻坚与创新突破,致力于推动通用人工智能(AGI)技术的实质性进展。团队聚焦LLM后训练方向,包括模型对齐、高阶推理、安全可控等,持续完善智能系统的认知深度与可靠性。目前部门拥有数万张显卡资源,并且仍在持续加大投入,为探索模型能力边界提供坚实的保障。在追求AGI的道路上,我们始终秉持蚂蚁集团的技术务实基因,通过扎实的底层创新推动智能技术的产业落地。 1. 研发万亿参数LLM基模架构:大语言模型(LLM)后训练(post-train)全流程优化,设计高效分布式训练方案,进行十万亿token级别的超大规模训练,包括但不限于通用能力提升、安全对齐等方向; 2. 奥赛级别的LLM各项能力建设,迈向真正的AGI:前沿的高效强化学习算法设计,实现并应用SFT/RLHF/DPO/PPO/GRPO等算法,研发训推一体的大规模强化学习训练框架,探索多目标奖励模型、过程监督等前沿技术,提升模型在指令遵循、逻辑推理、多任务泛化等方面的性能; 3. 扩大工业与学术影响力:开源LLM模型及核心技术,发表顶会论文,贡献核心开源项目。
包括英文材料
学历+
Transformer+
https://huggingface.co/learn/llm-course/en/chapter1/4
Breaking down how Large Language Models work, visualizing how data flows through.
https://poloclub.github.io/transformer-explainer/
An interactive visualization tool showing you how transformer models work in large language models (LLM) like GPT.
https://www.youtube.com/watch?v=wjZofJX0v4M
Breaking down how Large Language Models work, visualizing how data flows through.
SFT+
https://cameronrwolfe.substack.com/p/understanding-and-using-supervised
Understanding how SFT works from the idea to a working implementation...
算法+
https://roadmap.sh/datastructures-and-algorithms
Step by step guide to learn Data Structures and Algorithms in 2025
https://www.hellointerview.com/learn/code
A visual guide to the most important patterns and approaches for the coding interview.
https://www.w3schools.com/dsa/
Python+
https://liaoxuefeng.com/books/python/introduction/index.html
中文,免费,零起点,完整示例,基于最新的Python 3版本。
https://www.learnpython.org/
a free interactive Python tutorial for people who want to learn Python, fast.
https://www.youtube.com/watch?v=K5KVEU3aaeQ
Master Python from scratch 🚀 No fluff—just clear, practical coding skills to kickstart your journey!
https://www.youtube.com/watch?v=rfscVS0vtbw
This course will give you a full introduction into all of the core concepts in python.
PyTorch+
https://datawhalechina.github.io/thorough-pytorch/
PyTorch是利用深度学习进行数据科学研究的重要工具,在灵活性、可读性和性能上都具备相当的优势,近年来已成为学术界实现深度学习算法最常用的框架。
https://www.youtube.com/watch?v=V_xro1bcAuA
Learn PyTorch for deep learning in this comprehensive course for beginners. PyTorch is a machine learning framework written in Python.
CUDA+
https://developer.nvidia.com/blog/even-easier-introduction-cuda/
This post is a super simple introduction to CUDA, the popular parallel computing platform and programming model from NVIDIA.
https://www.youtube.com/watch?v=86FAWCzIe_4
Lean how to program with Nvidia CUDA and leverage GPUs for high-performance computing and deep learning.
数据结构+
https://www.youtube.com/watch?v=8hly31xKli0
In this course you will learn about algorithms and data structures, two of the fundamental topics in computer science.
https://www.youtube.com/watch?v=B31LgI4Y4DQ
Learn about data structures in this comprehensive course. We will be implementing these data structures in C or C++.
https://www.youtube.com/watch?v=CBYHwZcbD-s
Data Structures and Algorithms full course tutorial java
还有更多 •••
相关职位
社招技术类-开发
1. 营销阵地C端玩法架构设计与实现,在快速迭代中沉淀抽象以提升研发效率 2. 电商导购心智产品建设与迭代,用数据、技术驱动业务效果提升 3. 支撑大促活动,解决高并发高难度技术课题,协同上下游落地跨团队项目,并保障项目稳定 4. 推荐系统迭代与调优,构建多维度策略能力,提升整体推荐分发效率与效果
更新于 2025-07-21杭州
社招2年以上技术类-开发
方向一: 客户端平台:iOS/Android 方向二: 1.客户端基础框架的定制、开发、优化。 2.Web技术研发,移动端跨端动态技术研发,包括生态语言、渲染技术 方向三: 1.面向支付宝客户端iOS/Android平台的智能化基础设施建设,赋能端内各业务场景; 2.负责端侧计算引擎的架构设计与开发,增强对用户的理解; 3.负责端云共享学习、在线学习等领域的技术体系建设; 4.负责终端大模型框架与应用落地 5.强烈责任心和团队合作精神,乐于探索未知领域。
更新于 2025-04-03北京|上海|杭州
社招3年以上技术类-数据
1、与业务需求结合,设计并落地创新型实验及准实验,提升实验的效率和洞察深度,探索机器学习技术、动线挖掘、模型预测等方法在因果推断中的应用场景,解决观测数据中因果关系的识别,研发新型因果推断方法,优化业务决策; 2、从理解业务问题到因果因推断相关领域方法论研究、原型验证、直到与工程团队合作将成熟的技术产品化,推动方法从理论到实践的转化。设计可扩展的实验框架,支持大规模、多场景下的因果推算与效果评估; 3、负责通过AB实验设计、因果推断、深度学习等手段,量化运营策略效果和价值,科学评估运营手段,为业务决策提效。
更新于 2025-07-28北京