logo of antgroup

蚂蚁金服蚂蚁集团-大模型算法专家-Post training-杭州

社招全职3年以上技术类-算法地点:杭州状态:招聘

任职要求


1、在后训练微调领域拥有丰富的项目经验,熟恶DPO、PPO、GRPO、KTO、ReFT等算法原理,具备扎实的数学基础,熟悉线性代数、概率统计、优化算法等。
2、对Megatron-LM、DeepSpeed等分布式框架及LLaMA-Factory、ms-swift等大模型微调工具库有一定的了解或相关开发经验。
3、具备优秀的算法研发能力…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1、参与设计并实现 代码生成(可视化方向)、Function call、RAG等方向的大模型后训练算法。
2、结合业务数据和场景,设计Post training的高质量数据构建方案(含数据洞察、数据合成、数据质量优化等)提升模型的应用效果。
3、与工程以及产运团队协作,参与或负责大语言模型、多模态大模型等业务场景的后训练端到端效果提升及落地;
4、密切关注业界 LLM 微调算法和数据提质领域的前沿论文,并整合新技术和算法到训练引擎中,提升框架的领先性。
包括英文材料
算法+
Megatron+
DeepSpeed+
还有更多 •••
相关职位

logo of antgroup
社招技术类-算法

1、参与设计并实现 代码生成(可视化方向)、Function call、RAG等方向的大模型后训练算法。 2、结合业务数据和场景,设计Post training的高质量数据构建方案(含数据洞察、数据合成、数据质量优化等)提升模型的应用效果。 3、与工程以及产运团队协作,参与或负责大语言模型、多模态大模型等业务场景的后训练端到端效果提升及落地; 4、密切关注业界 LLM 微调算法和数据提质领域的前沿论文,并整合新技术和算法到训练引擎中,提升框架的领先性;

更新于 2025-05-22杭州
logo of aliyun
社招3年以上云智能集团

1. 高质量垂域数据工程:深入优化垂直领域(如文本内容审核)的高质量数据构建与迭代方法论,持续提升数据的质量、多样性与生产效率。 2. 可扩展后训练体系:探索适配领域特性的 SFT/RL 算法,构建高效、稳定、可扩展的垂域模型后训练范式,系统性提升模型能力。 3. 前沿技术研究与落地:探索推理模型前沿技术(如高效蒸馏、reward system、agentic RL、test-time learning 等)以及模型可解释性技术,沉淀技术成果和影响力,并推动大模型相关技术在行业场景中的转化与落地,提升领域模型竞争力,支撑业务持续增长。

更新于 2026-01-05杭州
logo of aliyun
社招3年以上云智能集团

【部门介绍】 阿里云智能大数据和智能实验室致力于成为通义大模型与行业的桥梁,积极推动AI大模型时代各行业的智能化升级。团队主要负责行业语言大模型、多模态大模型以及大模型基础研究,主要技术成果已成功应用到智慧交通、城市治理、生物医疗、大型国际赛事(亚运会和奥运会)等多个行业大模型中。 【工作内容】 1、负责大模型核心技术的研究与开发,深入理解其工作原理,不断探索创新的技术及其应用场景;解决复杂问题的推理能力scaling up,探索Post-training的前沿技术,如Agent RL、test time learning,并参与research intern的指导,沉淀技术成果,提升部门的AI技术的影响力及AI产品的竞争力,以支撑业务的持续增长。 2、对大模型的效果进行持续调优,通过高效的Post-training手段(SFT、RL等)提升LLM领域模型在业务场景下的表现,支撑通义的AI普惠影响力建设和模型规模化调用。

更新于 2025-10-18杭州
logo of alibaba
社招4年以上

1.负责LLM后训练、包含但不限于SFT、RL Reasoning相关算法的研究及开发。 2.负责多模态理解、Agent相关基础算法,生成式检索/排序相关算法的研究及开发。 3.拆解业务需求,形成技术方案,作为小组长和团队一起完成业务逻辑开发,实现各类算法在用户画像建模,商品理解及推荐,复杂Query意图识别及召回等业务场景的落地。

更新于 2025-08-01杭州