logo of antgroup

蚂蚁金服蚂蚁集团-蚂蚁技术研究院-LLM系统研究员

社招全职3年以上技术-研究地点:北京 | 上海 | 杭州状态:招聘

任职要求


1. 具有至少 3 年以上的AI系统/分布式并行计算领域研发经验;
2. 熟悉 Transformer/MoE 等大模型结构、大模型训练/推理系统, 熟悉 sglang、v…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


"我们团队将致力于探索新型LLM架构的训练与推理加速技术,推动模型结构与算法层面的创新,全面提升LLM的效率与性能。
1. 研发Diffusion LLM的高效训练与推理框架,实现其推理性能1000倍的提升,突破现有扩散模型在语言生成中的效率瓶颈
2. 和LLM算法研究员合作,通过算法和系统的co-design,加速现有LLM的训练和推理
3. 针对新型LLM优化关键算子与分布式并行计算策略,显著降低其训练与推理成本
4. 开发面向LLM算子与并行计算的自动化优化框架,为算法研究人员提供一站式的自动优化解决方案,显著提升模型结构的开发效率与系统性能。"
包括英文材料
Transformer+
大模型+
vLLM+
还有更多 •••
相关职位

logo of antgroup
社招技术类-算法

1. 构建百亿-千亿级参数大模型的工业化数据管道原型系统,主导预训练数据(多语言/多模态)的数据质量治理体系设计,开发数据去噪、清洗、打标、去偏和毒性检测算法 2. 构建大模型多维度评估体系:开发面向领域任务的细粒度评估框架,设计红蓝军对抗性测试集,在细粒度层面建立能力-数据关联分析模型 3. 构建大模型Agent应用场景的交互数据闭环系统,开发自动化数据标注、推理轨迹数据监督和治理、幻觉检测和消除等技术模块 4. 研究预训练和后训练的数据智能新架构、新流程和新算法,包括但不限于小样本数据蒸馏、课程学习策略优化、数据价值量化评估等,并实现先进方法的工程化落地 5. 研究基于LLM的合成数据生成框架,探索多模态数据合成(代码/数学推理/跨模态对齐)方法,探索多模态思维链合成增强、对抗性和合作性数据增强等技术路线

更新于 2025-07-15北京|上海|杭州
logo of antgroup
社招3年以上技术-研究

我们团队将致力于探索新型LLM架构的训练与推理加速技术,推动模型结构与算法层面的创新,全面提升LLM的效率与性能。 1. 研发Diffusion LLM的高效训练与推理框架,实现其推理性能1000倍的提升,突破现有扩散模型在语言生成中的效率瓶颈 2. 和LLM算法研究员合作,通过算法和系统的co-design,加速现有LLM的训练和推理 3. 针对新型LLM优化关键算子与分布式并行计算策略,显著降低其训练与推理成本 4. 开发面向LLM算子与并行计算的自动化优化框架,为算法研究人员提供一站式的自动优化解决方案,显著提升模型结构的开发效率与系统性能。

更新于 2025-12-17北京|上海|杭州
logo of antgroup
实习蚂蚁技术研究院长

1.加速LLM新模型架构里的算子和计算图; 2.加速LLM的分布式训练和推理; 3.设计新的算法和框架自动化优化LLM算子,计算图和分布式计算。

北京
logo of antgroup
社招技术类-开发

1. 营销阵地C端玩法架构设计与实现,在快速迭代中沉淀抽象以提升研发效率 2. 电商导购心智产品建设与迭代,用数据、技术驱动业务效果提升 3. 支撑大促活动,解决高并发高难度技术课题,协同上下游落地跨团队项目,并保障项目稳定 4. 推荐系统迭代与调优,构建多维度策略能力,提升整体推荐分发效率与效果

更新于 2025-07-21杭州