蚂蚁金服蚂蚁集团-大模型AI工程师-上海/北京
社招全职3年以上技术-开发地点:上海 | 北京状态:招聘
任职要求
1. 硕士及以上学历,计算机科学或相关专业背景 2. 具备扎实的算法工程实现能力,熟练掌握Python编程框架和PyTorch等深度学习框架,熟悉DeepSpeed/Megatron等主流分布式训练框架 3. 具备良好的分析和问题解决能力、优秀的工程素养,能够独立思考和解决实际问题 4. 具备较强的团队合作能力和沟通能力,能够与算法…
登录查看完整任职要求
微信扫码,1秒登录
工作职责
1. 参与构建蚂蚁百灵系列大模型系统的构建,包括但不限于语言模型、多模态模型、强化学习系统的算法框架、语料合成、训推优化、模型调优等 2. 参与推理、规划、数学、代码等领域的语料合成、求解器等开发工作,结合大模型自身能力评估,为其提供高质量、可验证的语料数据 3. 探索效果、数据驱动的模型优化方法,从问题出发,通过模型、数据、链路的优化,提升模型的端到端性能和效果表现。
包括英文材料
学历+
算法+
https://roadmap.sh/datastructures-and-algorithms
Step by step guide to learn Data Structures and Algorithms in 2025
https://www.hellointerview.com/learn/code
A visual guide to the most important patterns and approaches for the coding interview.
https://www.w3schools.com/dsa/
Python+
https://liaoxuefeng.com/books/python/introduction/index.html
中文,免费,零起点,完整示例,基于最新的Python 3版本。
https://www.learnpython.org/
a free interactive Python tutorial for people who want to learn Python, fast.
https://www.youtube.com/watch?v=K5KVEU3aaeQ
Master Python from scratch 🚀 No fluff—just clear, practical coding skills to kickstart your journey!
https://www.youtube.com/watch?v=rfscVS0vtbw
This course will give you a full introduction into all of the core concepts in python.
PyTorch+
https://datawhalechina.github.io/thorough-pytorch/
PyTorch是利用深度学习进行数据科学研究的重要工具,在灵活性、可读性和性能上都具备相当的优势,近年来已成为学术界实现深度学习算法最常用的框架。
https://www.youtube.com/watch?v=V_xro1bcAuA
Learn PyTorch for deep learning in this comprehensive course for beginners. PyTorch is a machine learning framework written in Python.
深度学习+
https://d2l.ai/
Interactive deep learning book with code, math, and discussions.
DeepSpeed+
https://www.youtube.com/watch?v=pDGI668pNg0
Megatron+
https://www.youtube.com/watch?v=hc0u4avAkuM
Kaggle+
[英文] Kaggle Learn
https://www.kaggle.com/learn
Gain the skills you need to do independent data science projects.
还有更多 •••
相关职位
社招5年以上技术类-开发
1、负责基于异构计算SoC,针对大模型等AI应用场景的性能优化; 2、参与芯片SoC架构分析、优化算法的硬件实现,确保系统性能、功耗和成本的平衡; 3、参与软硬件规划、接口定义等;
更新于 2025-06-03北京|上海
社招2年以上A05461A
1、负责AI ToB语音产品落地应用的服务架构研发,快速搭建AI语音相关平台应用、后端服务链路,持续优化产品体验、稳定性; 2、将基于前沿深度学习、大模型相关的语音、对话、LLM技术框架落地应用到实际业务中; 3、持续探索在各种场景下,利用AI语音能力增强产品体验,提升工程效率; 4、为火山引擎相关产品提供AI语音、对话技术服务,用AI技术影响数亿用户。
更新于 2024-07-16北京
社招2年以上金融服务平台
1.参与金融领域AI大模型的架构设计与工程落地,聚焦LLM、多模态大模型等前沿技术探索,推动其在智能营销、智能催收等场景的应用突破。 2.负责解决AI模型在智能交互机器人中的技术问题,实现业务场景的实时互动和个性化服务。 3.参与构建金融领域的AI基础设施(AI-infra),落地并完善RAG增强和Multi-Agent框架的配套工具链。 4.搭建支持智能交互机器人全面发展的技术生态,使其在各应用场景中具备更强大的适应能力。
更新于 2025-03-17北京|上海