阿里巴巴业务技术-【急聘】大语言模型(LLM)算法工程师-AI软件研发方向
社招全职1年以上地点:杭州状态:招聘
任职要求
1. 专业背景: 计算机、人工智能、软件工程等相关专业硕士及以上学历,3年以上经验;精通Python及至少一种深度学习框架(如PyTorch)。 2. 模型经验: 具备扎实的NLP基础和LLM(如GPT/Llama)项目经验,熟悉预训练、SFT、RLHF等关键技术,有实际的大模型训练和优化经验。 3. 软件工程思维(重要加分项): 理解软件研发全流程,熟悉代码分析、系统架构等;有将AI技术应用于软件工程(AI for SE)领域,或具备知识图谱、知识工程背景者优先。 4. 综合素质: 具备出色的问题拆解和解决能力,强自驱力与团队协作精神,对用AI解决复杂研发问题充满热情。
工作职责
背景介绍: 我们正在构建一个深度理解淘宝研发上下文的领域大模型,目标是打造一个具备“架构师级”洞察力的AI模型,从根本上提升研发效率与质量。如果你渴望在一个真实、复杂的场景中,将LLM的能力推向新的高度,并亲手塑造下一代软件研发的未来,我们期待你的加入! 1. 领域模型训练: 负责淘宝研发领域大模型的核心算法,主导持续预训练(Continual Pre-training)、指令微调(SFT)和对齐(RLHF/DPO)等训练流程; 2. 知识注入与推理: 设计并实践创新的数据方案,将代码、文档、配置等异构研发知识高效注入模型;通过多任务学习、FIM等范式,增强模型对软件工程的深度理解与复杂推理能力; 3. 能力评估与迭代: 建立科学的评测体系,精准评估模型在代码溯源、影响分析、故障排查等高阶任务上的能力;分析bad case,驱动数据和算法的闭环优化。
包括英文材料
学历+
Python+
https://liaoxuefeng.com/books/python/introduction/index.html
中文,免费,零起点,完整示例,基于最新的Python 3版本。
https://www.learnpython.org/
a free interactive Python tutorial for people who want to learn Python, fast.
https://www.youtube.com/watch?v=K5KVEU3aaeQ
Master Python from scratch 🚀 No fluff—just clear, practical coding skills to kickstart your journey!
https://www.youtube.com/watch?v=rfscVS0vtbw
This course will give you a full introduction into all of the core concepts in python.
深度学习+
https://d2l.ai/
Interactive deep learning book with code, math, and discussions.
PyTorch+
https://datawhalechina.github.io/thorough-pytorch/
PyTorch是利用深度学习进行数据科学研究的重要工具,在灵活性、可读性和性能上都具备相当的优势,近年来已成为学术界实现深度学习算法最常用的框架。
https://www.youtube.com/watch?v=V_xro1bcAuA
Learn PyTorch for deep learning in this comprehensive course for beginners. PyTorch is a machine learning framework written in Python.
NLP+
https://www.youtube.com/watch?v=fNxaJsNG3-s&list=PLQY2H8rRoyvzDbLUZkbudP-MFQZwNmU4S
Welcome to Zero to Hero for Natural Language Processing using TensorFlow!
https://www.youtube.com/watch?v=R-AG4-qZs1A&list=PLeo1K3hjS3uuvuAXhYjV2lMEShq2UYSwX
Natural Language Processing tutorial for beginners series in Python.
https://www.youtube.com/watch?v=rmVRLeJRkl4&list=PLoROMvodv4rMFqRtEuo6SGjY4XbRIVRd4
The foundations of the effective modern methods for deep learning applied to NLP.
大模型+
https://www.youtube.com/watch?v=xZDB1naRUlk
You will build projects with LLMs that will enable you to create dynamic interfaces, interact with vast amounts of text data, and even empower LLMs with the capability to browse the internet for research papers.
https://www.youtube.com/watch?v=zjkBMFhNj_g
GPT+
https://www.youtube.com/watch?v=kCc8FmEb1nY
We build a Generatively Pretrained Transformer (GPT), following the paper "Attention is All You Need" and OpenAI's GPT-2 / GPT-3.
Llama+
https://github.com/LlamaFamily/Llama-Chinese
Llama中文社区,实时汇总最新Llama学习资料,构建最好的中文Llama大模型开源生态,完全开源可商用。
https://www.llama.com/docs/overview/
This guide provides information and resources to help you set up Llama including how to access the model, hosting, how-to and integration guides.
SFT+
https://cameronrwolfe.substack.com/p/understanding-and-using-supervised
Understanding how SFT works from the idea to a working implementation...
相关职位
社招
1. 负责业务技术相关的技术支持工作,跟进解决业务方,ISV,商家,客满团队反馈的线上问题及业务咨询。 2. 定期对平台问题开展质量回溯工作,透传质量和业务需优化内容,发掘客户需求和行业痛点,并形成建议报告, 与产品,研发团队一起完成优化需求的推动落地、解决疑难,故障问题。助力完善和优化业务平台。 3. 根据线上反馈及业务咨询,完成内容梳理,沉淀解决方案。 4.作为咨询顾问团,从平台角度沉淀、定义并向二方输出电商技术or业务解决方案,过程中对接并提供平台商业能力(星环)sdk面向开发者的技术支持。 5.具备定义问题和解决问题的能力,能针对平台能力、业务技术方案、及总结的经验内容定向对业务方,客满及相关团队做系统性的运营、宣传及培训,做好去中心化赋能建设。
更新于 2025-04-17
社招
作为AI算法工程师,您将负责探索Transformer、强化学习、Diffusion模型等AI技术在表情驱动及动作驱动领域的创新应用。您将参与前沿技术研发,推动AI与图形学的融合,提升虚拟角色、游戏、影视等场景的交互真实感和效率。 岗位职责 1. 构建基于Transformer与强化学习的虚拟角色表情/动作生成模型,实现高拟真驱动; 2. 深度协同美术与引擎团队,推进AI在虚拟人、3D购物等场景的工程化应用; 3. 跟踪AI+图形学技术前沿(如神经渲染、生成式模型),挖掘潜在技术突破点。
更新于 2025-04-17
社招1年以上
1、负责营销工具相关业务功能的开发,深入发掘业务需求,独当一面,包括需求分析、架构设计和代码实现; 2、理解并掌握集团营销平台的业务模型、产品模型、技术模型,与团队一起持续创新产品功能; 3、深入理解底层技术,能够通过技术创新帮助到营销平台更加稳定和高效,同时支持好各业务方的大促活动。
更新于 2025-07-15