蚂蚁金服蚂蚁集团-大模型系统工程师-平台架构
社招全职技术类-开发地点:杭州状态:招聘
任职要求
1.计算机或数学相关专业的硕士或博士,发表过计算机领域、数学领域相关顶会论文者优先;在顶级计算机竞赛、或计算机榜单成绩优异者优先; 2.有优秀的代码开发能力,精通Python、Java、C++等至少一门编程语言;熟悉研发流程,扎实掌握计算机原理、数据结构、IO、线程/进程等原理及研发技能; 3.熟悉开源推理加速框架,如vLLM/sglang/TGI/DeepSpeed/Ligh…
登录查看完整任职要求
微信扫码,1秒登录
工作职责
1.负责以大模型为代表的AI技术能力的建设和优化,打造业界领先的AI技术系统。主要职责包括AI系统结构设计,大模型训练数据构建,大模型能力评测,大模型推理效果和效率优化等; 2.紧密跟踪、探索大模型方向前沿技术,依托丰富且体系化的业务生态,实践大模型等AI技术创新应用与落地。
包括英文材料
Python+
https://liaoxuefeng.com/books/python/introduction/index.html
中文,免费,零起点,完整示例,基于最新的Python 3版本。
https://www.learnpython.org/
a free interactive Python tutorial for people who want to learn Python, fast.
https://www.youtube.com/watch?v=K5KVEU3aaeQ
Master Python from scratch 🚀 No fluff—just clear, practical coding skills to kickstart your journey!
https://www.youtube.com/watch?v=rfscVS0vtbw
This course will give you a full introduction into all of the core concepts in python.
Java+
https://www.youtube.com/watch?v=eIrMbAQSU34
Master Java – a must-have language for software development, Android apps, and more! ☕️ This beginner-friendly course takes you from basics to real coding skills.
C+++
https://www.learncpp.com/
LearnCpp.com is a free website devoted to teaching you how to program in modern C++.
https://www.youtube.com/watch?v=ZzaPdXTrSb8
数据结构+
https://www.youtube.com/watch?v=8hly31xKli0
In this course you will learn about algorithms and data structures, two of the fundamental topics in computer science.
https://www.youtube.com/watch?v=B31LgI4Y4DQ
Learn about data structures in this comprehensive course. We will be implementing these data structures in C or C++.
https://www.youtube.com/watch?v=CBYHwZcbD-s
Data Structures and Algorithms full course tutorial java
vLLM+
https://www.newline.co/@zaoyang/ultimate-guide-to-vllm--aad8b65d
vLLM is a framework designed to make large language models faster, more efficient, and better suited for production environments.
https://www.youtube.com/watch?v=Ju2FrqIrdx0
vLLM is a cutting-edge serving engine designed for large language models (LLMs), offering unparalleled performance and efficiency for AI-driven applications.
还有更多 •••
相关职位
社招技术类-开发
1.负责大模型基座或智能体评测方法、评测Benchmark、评测平台的建设; 2.使用统计、机器学习技术来分析模型输出,识别模式和潜在问题,编写技术报告,总结评测结果和提出改进建议; 3.跟踪最新的AI评测技术和工具,并将其集成到我们的评测流程中; 4.与算法专家和工程师团队合作,了解模型的功能和限制;紧跟业务,确保评测结果能够指导产品迭代和优化。
更新于 2025-07-23杭州
社招技术类
1.负责多模态大模型GPU/CPU上训练和推理平台的开发和维护,提升平台整体的运行效率和稳定性; 2.参与多模态大模型的整体系统架构设计,包括数据流、计算图、分布式训练与推理框架; 3.负责大模型的业务探索,与相关团队紧密配合,将多模态模型落地到具体业务场景,提升业务收益。
更新于 2025-08-13上海
社招3-5年数字技术
1.负责公司AI平台架构设计,包括但不限于改善训练及推理效率、超大规模训练、智算平台等; 2.负责设计、研发大模型算法开发组件,包括但不限于微调软件框架、模型流水线等; 3.规划AI平台技术发展方向,跟进业界前沿技术,实现面向端到端大模型系统的极致性能优化。
更新于 2024-11-12北京
社招A198435
团队介绍:团队负责抖音集团内容审核、内容理解等方向的架构支持工作,业务范围覆盖抖音、今日头条、剪映等多个重要业务线,工作内容涵盖特征计算编排、大模型推理/训练框架、RAG等大模型应用、GPU/CPU资源治理、数据平台等系统建设及优化,与算法团队一起推进大模型在业务场景的应用落地,解决大模型应用过程中的各种工程挑战。 1、负责大模型推理系统架构设计及优化,密切配合算法部门,持续优化大模型研发和部署效率; 2、负责跟踪探索多种大模型推理技术,包括量化、蒸馏、TRT-LLM&vLLM、Kernel优化等理论研究和实践开发,极致提升推理性能; 3、负责GPU资源管理和治理,提升GPU资源使用效率。
更新于 2025-03-12北京