蚂蚁金服【蚂蚁星-Plan A】多模态大模型研发-生成与理解统一
校招全职2026届蚂蚁星- Plan A人才计划地点:北京 | 上海 | 杭州状态:停招
任职要求
1. 计算机科学、人工智能、数学等相关专业硕士及以上学历,博士优先; 2. 深入掌握Transformer/BERT/GPT等架构,有1个以上千亿参数大模型实战经验(训练/推理/优化全流程); 3. 精通多模态技术栈:CLIP/BLIP/Flamingo等跨模态模型调优,熟悉Diffusion/Stable Diffusion等生成模型; 4. 熟练使用PyTorch/TensorFlow框架,有Megatron-DeepSpeed/FairScale等分布式训练实战经验; 5. 掌…
登录查看完整任职要求
微信扫码,1秒登录
工作职责
蚂蚁集团 - 基础智能团队 我们团队主要负责蚂蚁集团的通用大模型研发工作。我们提供国内顶尖的算力资源,致力于建设基于大模型的AGI技术。我们期待同样以实现AGI为目标的您的加入,共同推动人工智能技术的发展。目前,我们正在进行: 多模态大模型研发: 研发高效的多模态预训练模型架构。探索和实现多模态融合技术,优化多模态模型的训练策略和推理效率。 1. 统一架构研发 研发多模态理解与生成一体化架构,设计统一表征模型(文本/图像/视频/语音),攻克跨模态语义对齐、动态路由、混合模态生成等关键技术 主导千亿级参数多模态模型的分布式训练优化(数据并行+流水线并行+专家混合),实现训练成本降低与性能提升 2. 端到端系统构建 构建支持多模态输入输出的实时交互系统(端到端延迟<200ms),优化推理引擎(KV Cache量化、动态批处理、显存卸载) 开发多模态自监督学习框架,实现跨模态数据自动挖掘与合成(如视频-文本弱监督对齐) 3. 技术前瞻研究 探索多模态大模型技术边界,包括但不限于:理解与生成统一、跨模态融合、多模态世界模型构建 参与制定行业技术标准,主导国际顶会论文发表(CVPR/ICML/NeurIPS)及开源项目贡献
包括英文材料
学历+
Transformer+
https://huggingface.co/learn/llm-course/en/chapter1/4
Breaking down how Large Language Models work, visualizing how data flows through.
https://poloclub.github.io/transformer-explainer/
An interactive visualization tool showing you how transformer models work in large language models (LLM) like GPT.
https://www.youtube.com/watch?v=wjZofJX0v4M
Breaking down how Large Language Models work, visualizing how data flows through.
BERT+
https://www.youtube.com/watch?v=xI0HHN5XKDo
Understand the BERT Transformer in and out.
GPT+
https://www.youtube.com/watch?v=kCc8FmEb1nY
We build a Generatively Pretrained Transformer (GPT), following the paper "Attention is All You Need" and OpenAI's GPT-2 / GPT-3.
大模型+
https://www.youtube.com/watch?v=xZDB1naRUlk
You will build projects with LLMs that will enable you to create dynamic interfaces, interact with vast amounts of text data, and even empower LLMs with the capability to browse the internet for research papers.
https://www.youtube.com/watch?v=zjkBMFhNj_g
Stable Diffusion+
https://course.fast.ai/Lessons/lesson9.html
This lesson starts with a tutorial on how to use pipelines in the Diffusers library to generate images.
https://www.youtube.com/watch?v=dMkiOex_cKU
earn how to use Stable Diffusion to create art and images in this full course.
PyTorch+
https://datawhalechina.github.io/thorough-pytorch/
PyTorch是利用深度学习进行数据科学研究的重要工具,在灵活性、可读性和性能上都具备相当的优势,近年来已成为学术界实现深度学习算法最常用的框架。
https://www.youtube.com/watch?v=V_xro1bcAuA
Learn PyTorch for deep learning in this comprehensive course for beginners. PyTorch is a machine learning framework written in Python.
还有更多 •••