蚂蚁金服蚂蚁集团-蚂蚁技术研究院-LLM系统研究员
社招全职3年以上技术-研究地点:北京 | 上海 | 杭州状态:招聘
任职要求
1. 具有至少 3 年以上的AI系统/分布式并行计算领域研发经验; 2. 熟悉 Transformer/MoE 等大模型结构、大模型训练/推理系统, 熟悉 sglang、v…
登录查看完整任职要求
微信扫码,1秒登录
工作职责
"我们团队将致力于探索新型LLM架构的训练与推理加速技术,推动模型结构与算法层面的创新,全面提升LLM的效率与性能。 1. 研发Diffusion LLM的高效训练与推理框架,实现其推理性能1000倍的提升,突破现有扩散模型在语言生成中的效率瓶颈 2. 和LLM算法研究员合作,通过算法和系统的co-design,加速现有LLM的训练和推理 3. 针对新型LLM优化关键算子与分布式并行计算策略,显著降低其训练与推理成本 4. 开发面向LLM算子与并行计算的自动化优化框架,为算法研究人员提供一站式的自动优化解决方案,显著提升模型结构的开发效率与系统性能。"
包括英文材料
Transformer+
https://huggingface.co/learn/llm-course/en/chapter1/4
Breaking down how Large Language Models work, visualizing how data flows through.
https://poloclub.github.io/transformer-explainer/
An interactive visualization tool showing you how transformer models work in large language models (LLM) like GPT.
https://www.youtube.com/watch?v=wjZofJX0v4M
Breaking down how Large Language Models work, visualizing how data flows through.
大模型+
https://www.youtube.com/watch?v=xZDB1naRUlk
You will build projects with LLMs that will enable you to create dynamic interfaces, interact with vast amounts of text data, and even empower LLMs with the capability to browse the internet for research papers.
https://www.youtube.com/watch?v=zjkBMFhNj_g
vLLM+
https://www.newline.co/@zaoyang/ultimate-guide-to-vllm--aad8b65d
vLLM is a framework designed to make large language models faster, more efficient, and better suited for production environments.
https://www.youtube.com/watch?v=Ju2FrqIrdx0
vLLM is a cutting-edge serving engine designed for large language models (LLMs), offering unparalleled performance and efficiency for AI-driven applications.
还有更多 •••
相关职位
社招3年以上技术-研究
我们团队将致力于探索新型LLM架构的训练与推理加速技术,推动模型结构与算法层面的创新,全面提升LLM的效率与性能。 1. 研发Diffusion LLM的高效训练与推理框架,实现其推理性能1000倍的提升,突破现有扩散模型在语言生成中的效率瓶颈 2. 和LLM算法研究员合作,通过算法和系统的co-design,加速现有LLM的训练和推理 3. 针对新型LLM优化关键算子与分布式并行计算策略,显著降低其训练与推理成本 4. 开发面向LLM算子与并行计算的自动化优化框架,为算法研究人员提供一站式的自动优化解决方案,显著提升模型结构的开发效率与系统性能。
更新于 2025-12-17北京|上海|杭州
社招技术类-算法
1. 构建百亿-千亿级参数大模型的工业化数据管道原型系统,主导预训练数据(多语言/多模态)的数据质量治理体系设计,开发数据去噪、清洗、打标、去偏和毒性检测算法 2. 构建大模型多维度评估体系:开发面向领域任务的细粒度评估框架,设计红蓝军对抗性测试集,在细粒度层面建立能力-数据关联分析模型 3. 构建大模型Agent应用场景的交互数据闭环系统,开发自动化数据标注、推理轨迹数据监督和治理、幻觉检测和消除等技术模块 4. 研究预训练和后训练的数据智能新架构、新流程和新算法,包括但不限于小样本数据蒸馏、课程学习策略优化、数据价值量化评估等,并实现先进方法的工程化落地 5. 研究基于LLM的合成数据生成框架,探索多模态数据合成(代码/数学推理/跨模态对齐)方法,探索多模态思维链合成增强、对抗性和合作性数据增强等技术路线
更新于 2025-07-15北京|上海|杭州