蚂蚁金服【Plan A】算法工程师-LLM后训练-灵光-27届
校招全职2027届蚂蚁星- Plan A人才计划地点:杭州状态:招聘
任职要求
1.在后训练微调领域拥有丰富的项目经验,熟恶DPO、PPO、GRPO、OPSD等算法原理,具备扎实的数学基础,熟悉线性代数、概率统计、优化算法等。; 2.对Megatron-LM、DeepSpeed等分布式框架及LLaMA-Factory、ms-swift等大模型微调工具库有一定的了解或相关开发经验; 3.具备优秀的算法…
登录查看完整任职要求
微信扫码,1秒登录
工作职责
部门介绍: 灵光APP是一款原生多模态的AGI助手,团队致力于构建有竞争力的AGI产品体验。算法团队以用户体验为牵引,为灵光助手构建后训练体系和模型。驱动灵光在智能体验上保持业界领先。 职位描述: 1.参与设计并实现 代码生成(可视化方向)、Agent等方向的大模型后训练算法; 2.结合业务数据和场景,设计Post training的高质量数据构建方案(含数据洞察、数据合成、数据质量优化等)提升模型的应用效果; 3.与工程以及产运团队协作,参与或负责大语言模型、多模态大模型等业务场景的后训练端到端效果提升及落地; 4.密切关注业界 LLM 微调算法和数据提质领域的前沿论文,并整合新技术和算法到训练引擎中,提升框架的领先性。
包括英文材料
算法+
https://roadmap.sh/datastructures-and-algorithms
Step by step guide to learn Data Structures and Algorithms in 2025
https://www.hellointerview.com/learn/code
A visual guide to the most important patterns and approaches for the coding interview.
https://www.w3schools.com/dsa/
Megatron+
https://www.youtube.com/watch?v=hc0u4avAkuM
DeepSpeed+
https://www.youtube.com/watch?v=pDGI668pNg0
还有更多 •••