logo of antgroup

蚂蚁金服【蚂蚁星-Plan A】算法工程师-后训练

校招全职蚂蚁星计划 - Plan A地点:北京 | 上海 | 杭州状态:招聘

任职要求


1. 计算机科学、人工智能、数学等相关专业硕士及以上学历,深入理解 Transformer 架构及SFT/RLHF/DPO/PPO/GRPO等算法。
2. 编码能力:
1)熟练掌握 PythonPyTorch,具备分布式训练(如多机多卡调优)经验,高性能计算代码开发经验(如CUDA编程、SIMD指令优化)更佳;
2)深入理解算法数据结构,能针对LLM场景优化核心算法(如Attention计算、KV Cache管理)的时空复杂度;
3)熟悉代码…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


作为蚂蚁集团的核心大模型部门,我们专注大语言模型的技术攻坚与创新突破,致力于推动通用人工智能(AGI)技术的实质性进展。团队聚焦LLM后训练方向,包括模型对齐、高阶推理、安全可控等,持续完善智能系统的认知深度与可靠性。目前部门拥有数万张显卡资源,并且仍在持续加大投入,为探索模型能力边界提供坚实的保障。在追求AGI的道路上,我们始终秉持蚂蚁集团的技术务实基因,通过扎实的底层创新推动智能技术的产业落地。
1. 研发万亿参数LLM基模架构:大语言模型(LLM)后训练(post-train)全流程优化,设计高效分布式训练方案,进行十万亿token级别的超大规模训练,包括但不限于通用能力提升、安全对齐等方向;
2. 奥赛级别的LLM各项能力建设,迈向真正的AGI:前沿的高效强化学习算法设计,实现并应用SFT/RLHF/DPO/PPO/GRPO等算法,研发训推一体的大规模强化学习训练框架,探索多目标奖励模型、过程监督等前沿技术,提升模型在指令遵循、逻辑推理、多任务泛化等方面的性能;
3. 扩大工业与学术影响力:开源LLM模型及核心技术,发表顶会论文,贡献核心开源项目。
包括英文材料
学历+
Transformer+
SFT+
算法+
Python+
PyTorch+
CUDA+
数据结构+
还有更多 •••
相关职位

logo of antgroup
社招技术类-开发

1. 营销阵地C端玩法架构设计与实现,在快速迭代中沉淀抽象以提升研发效率 2. 电商导购心智产品建设与迭代,用数据、技术驱动业务效果提升 3. 支撑大促活动,解决高并发高难度技术课题,协同上下游落地跨团队项目,并保障项目稳定 4. 推荐系统迭代与调优,构建多维度策略能力,提升整体推荐分发效率与效果

更新于 2025-07-21杭州
logo of antgroup
社招2年以上技术类-开发

方向一: 客户端平台:iOS/Android 方向二: 1.客户端基础框架的定制、开发、优化。 2.Web技术研发,移动端跨端动态技术研发,包括生态语言、渲染技术 方向三: 1.面向支付宝客户端iOS/Android平台的智能化基础设施建设,赋能端内各业务场景; 2.负责端侧计算引擎的架构设计与开发,增强对用户的理解; 3.负责端云共享学习、在线学习等领域的技术体系建设; 4.负责终端大模型框架与应用落地 5.强烈责任心和团队合作精神,乐于探索未知领域。

更新于 2025-04-03北京|上海|杭州
logo of antgroup
社招3年以上技术类-数据

1、与业务需求结合,设计并落地创新型实验及准实验,提升实验的效率和洞察深度,探索机器学习技术、动线挖掘、模型预测等方法在因果推断中的应用场景,解决观测数据中因果关系的识别,研发新型因果推断方法,优化业务决策; 2、从理解业务问题到因果因推断相关领域方法论研究、原型验证、直到与工程团队合作将成熟的技术产品化,推动方法从理论到实践的转化。设计可扩展的实验框架,支持大规模、多场景下的因果推算与效果评估; 3、负责通过AB实验设计、因果推断、深度学习等手段,量化运营策略效果和价值,科学评估运营手段,为业务决策提效。

更新于 2025-07-28北京
logo of antgroup
社招3年以上技术类-开发

1.负责蚂蚁数据标注平台的开发、参与蚂蚁 AI 标注引擎的建设; 2.根据用户需求,进行平台产品的业务抽象、技术方案设计和实现; 3.有大流量高并发系统设计和性能调优经验为佳。

更新于 2025-04-03北京