logo of antgroup

蚂蚁金服蚂蚁集团-大模型算法专家-Post training-杭州

社招全职3年以上技术类-算法地点:杭州状态:招聘

任职要求


1、在后训练微调领域拥有丰富的项目经验,熟恶DPO、PPO、GRPO、KTO、ReFT等算法原理,具备扎实的数学基础,熟悉线性代数、概率统计、优化算法等。
2、对Megatron-LM、DeepSpeed等分布式框架及LLaMA-Factory、ms-swift大模型微调工具库有一定的了解或相关开发经验。
3、具备优秀的算法研发能力,对LLM领域前沿技术有热情,能够自驱地设计丰富的实验并完成论文技术的落地验证。
4、拥有良好的沟通表达能力和团队协作精神,具有强烈的责任心和使命感。

加分项:
1:在顶级会议或期刊上发表过相关研究论文。
2:拥有LLM领域大规模数据处理经验。
3:在后训练微调引擎方面具有实战经验。
4:有代码大模型的调优经验。
5:熟悉可视化组件。

工作职责


1、参与设计并实现 代码生成(可视化方向)、Function call、RAG等方向的大模型后训练算法。
2、结合业务数据和场景,设计Post training的高质量数据构建方案(含数据洞察、数据合成、数据质量优化等)提升模型的应用效果。
3、与工程以及产运团队协作,参与或负责大语言模型、多模态大模型等业务场景的后训练端到端效果提升及落地;
4、密切关注业界 LLM 微调算法和数据提质领域的前沿论文,并整合新技术和算法到训练引擎中,提升框架的领先性;
包括英文材料
算法+
Megatron+
DeepSpeed+
LLaMA-Factory+
Swift+
大模型+
相关职位

logo of antgroup
社招技术类-算法

1、参与设计并实现 代码生成(可视化方向)、Function call、RAG等方向的大模型后训练算法。 2、结合业务数据和场景,设计Post training的高质量数据构建方案(含数据洞察、数据合成、数据质量优化等)提升模型的应用效果。 3、与工程以及产运团队协作,参与或负责大语言模型、多模态大模型等业务场景的后训练端到端效果提升及落地; 4、密切关注业界 LLM 微调算法和数据提质领域的前沿论文,并整合新技术和算法到训练引擎中,提升框架的领先性;

更新于 2025-05-22
logo of aliyun
社招3年以上云智能集团

【部门介绍】 阿里云智能大数据和智能实验室致力于成为通义大模型与行业的桥梁,积极推动AI大模型时代各行业的智能化升级。团队主要负责行业语言大模型、多模态大模型以及大模型基础研究,主要技术成果已成功应用到智慧交通、城市治理、生物医疗、大型国际赛事(亚运会和奥运会)等多个行业大模型中。 【工作内容】 1、负责大模型核心技术的研究与开发,深入理解其工作原理,不断探索创新的技术及其应用场景;解决复杂问题的推理能力scaling up,探索Post-training的前沿技术,如Agent RL、test time learning,并参与research intern的指导,沉淀技术成果,提升部门的AI技术的影响力及AI产品的竞争力,以支撑业务的持续增长。 2、对大模型的效果进行持续调优,通过高效的Post-training手段(SFT、RL等)提升LLM领域模型在业务场景下的表现,支撑通义的AI普惠影响力建设和模型规模化调用。

更新于 2025-10-18
logo of alibaba
社招4年以上

1.负责LLM后训练、包含但不限于SFT、RL Reasoning相关算法的研究及开发。 2.负责多模态理解、Agent相关基础算法,生成式检索/排序相关算法的研究及开发。 3.拆解业务需求,形成技术方案,作为小组长和团队一起完成业务逻辑开发,实现各类算法在用户画像建模,商品理解及推荐,复杂Query意图识别及召回等业务场景的落地。

更新于 2025-08-01
logo of alibaba
社招2年以上

1、通过Agent的算法架构设计、上下文工程、RAG、Memory优化,Policy生成、LLM post training等方法,提升【店铺AI导购机器人】回复的准确性和专业性,打造导购机器人行业标杆。 2、通过数据挖掘和分析找到用户在使用店铺AI导购机器人过程中的不良体验,找准算法优化的方向或形成对产品改进的建议。 3、通过优化模型尺寸、优化缓存技术等,降低离线训练成本和线上推理成本,提升回复的速度。 4、技术上探索智能体自进化(Self-Evolving)与终生学习(Lifelong Learning)的实现路径。

更新于 2025-09-12