logo of antgroup

蚂蚁金服蚂蚁集团-大语言模型后训练算法专家-杭州/上海/北京

社招全职3年以上技术类-算法地点:北京 | 上海 | 杭州状态:招聘

任职要求


1. 硕士及以上学历,计算机科学或相关专业背景。
2. 具备大模型研发经验,在 Post-Training(如SFT、RL、OPD等)某一方向上有实操积累。
3. 算法与工程兼备。熟悉数据与训练策略,也了解主流训练和推理框架(如 Megatron、SGLang、vLLM等)。
4. 具备极强的“发现问题-分析问题-解…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1. 负责包括 SFT(监督微调)、Model Merge(模型合并)、OPD(在线/离线知识蒸馏)以及 RL(强化学习)在内的后训练算法研发与优化,探索更高效、更稳定的新型训练范式。
2. 提升大模型在Reasoning、General Agent 以及Coding Agent等专项任务上的上限,构建具备深度思考和自主行动能力的基座模型。
3. 模型架构探索与优化,探索更高效更有效的模型架构。
4. 训练与推理效率的优化,如算子优化、显存优化等,实现高吞吐、低延迟的模型研发和落地。
包括英文材料
学历+
大模型+
SFT+
还有更多 •••
相关职位

logo of antgroup
社招3年以上技术类-算法

1. 负责研发大语言模型强化学习算法,提升大模型在强化学习阶段的训练效率,以及提升大模型在数学、代码等自然科学领域的推理能力 2. 负责研发奖励和评价模型,包括细粒度的过程监督和奖励建模,覆盖复杂推理、指令遵循等各种任务 3. 参与后训练和推理阶段的Scaling Law研究,包括奖励模型训练、强化学习训练、推理阶段的Scaling Law

更新于 2025-12-23北京|上海|杭州
logo of antgroup
社招3年以上技术类-开发

1. 支撑蚂蚁集团在各个业务领域的MLOps&LMOps算法研发工作,覆盖机器学习系统多个子方向领域的工作,包括:数据配比&全链路血缘建设、数据实验&分析、深度学习/大模型预训练/后训练/推理等,建设支持AI全链路的研发平台与AI垂类应用开发平台,实现算法研发效率、和资源利用率的最大化,灵活可扩展的支持不同领域的个性化应用开发需求,为蚂蚁大模型研发链路及应用研发探索新的研发模式; 2. 对平台进行全局性和前瞻性的架构设计和核心技术细节实现,帮助团队攻克各种技术难关,保障和提升平台稳定性。

更新于 2025-10-14北京|上海|杭州
logo of xiaohongshu
社招基础后端

负责设计、实现和维护AI高性能网络通信框架和大模型训练/推理场景的性能优化,聚焦模型通信场景的能力建设,完善集合通信、点对点通信等通信方式与训练/推理框架的联合方案设计,追求极致的训练/推理性能。

更新于 2025-08-08上海|北京|杭州
logo of xiaohongshu
社招1年以上基础后端

-负责公司新一代统一分布式存储(对象+文件)的核心架构设计与研发。面向 EB 级海量数据,打造百Tbps 级超高带宽与微秒级极低延迟的高可用存储服务,全面支撑AGI、社交、推荐、搜索、电商、广告等核心业务场景 -深入剖析大模型训练与推理的 I/O 特征,攻克集群计算中的 I/O带宽和延迟瓶颈与百亿文件等难题,保障采集、清洗、训练、发布等全流程在统一存储上无缝运行,彻底打破“存储墙”,极致提升 GPU 算力利用率。 -紧跟下一代硬件架构趋势,结合 PCIe 5.0 高带宽特性与QLC、FDP等新型固态存储技术进行底层 I/O 栈重构;探索 CXL 内存/存储池化、DPU/SmartNIC 硬件卸载及 GPUDirect Storage 技术,实现极致的内核旁路(Bypass Kernel)与端到端零拷贝优化,不断突破单机与集群的性能极限。

更新于 2026-04-09北京|上海|杭州