阿里巴巴算法工程师-大语言模型(代码研发 & 端侧模型)(T-Star Lab 日常实习)
实习兼职淘天集团T-Star日常实习生地点:杭州状态:招聘
任职要求
1. 计算机科学、人工智能、机器学习或相关领域专业、研究方向,硕士及以上学历在校生。 2. 在自然语言、LLM大模型、多模态大模型、大模型轻量化等相关领域的研究研发经验。 3. 具备出色的编程能力,熟练掌握Pytorch等深度学习框架和Python编程语言。 4. 敢于…
登录查看完整任职要求
微信扫码,1秒登录
工作职责
核心职责与研究课题: 1. 研发垂域大模型:面向淘宝复杂工程技术体系,构建懂淘宝上下文的研发垂域大模型。 ①设计面向复杂工程系统的大模型数据构建和训练策略,涵盖离线的研发数据的高质量组织与清洗、在线人机协同的用户轨迹数据组织与迭代、算法训练方式策略选择(CPT、SFT、RL/RLHF)等; ②攻克研发场景的大模型面临的工程系统关系理解、研发领域知识显式记忆与推理、研发域差异化任务规划及工具调用、及情景感知检索等方向难题,打造懂业务、懂架构的研发智能体能力。 2. 端侧大模型探索:结合淘宝开源端侧深度推理引擎 MNN,探索极致高效的端侧大模型技术。 ①摒弃单纯的模型压缩思路,以端侧NPU/CPU/GPU 的硬件特性牵引大模型架构设计,探索并设计适合端侧运行的高效模型架构,在有限算力下突破性能瓶颈; ②负责端侧模型的全流程训练探索,涉及从预训练及后训练优化,结合投机采样、KV Cache优化、混合量化等优化,得到高性能的端侧大模型。 T-Star实习可以带给你什么? ① 加入前沿技术探索队伍,参与顶级课题研究,有机会实现工业界项目落地。 ② 跟企业大牛导师/学术界名导一起做有价值的课题。 ③ 丰富的技术资源、海量的数据与优秀的团队助力发paper。
包括英文材料
机器学习+
https://www.youtube.com/watch?v=0oyDqO8PjIg
Learn about machine learning and AI with this comprehensive 11-hour course from @LunarTech_ai.
https://www.youtube.com/watch?v=i_LwzRVP7bg
Learn Machine Learning in a way that is accessible to absolute beginners.
https://www.youtube.com/watch?v=NWONeJKn6kc
Learn the theory and practical application of machine learning concepts in this comprehensive course for beginners.
https://www.youtube.com/watch?v=PcbuKRNtCUc
Learn about all the most important concepts and terms related to machine learning and AI.
学历+
大模型+
https://www.youtube.com/watch?v=xZDB1naRUlk
You will build projects with LLMs that will enable you to create dynamic interfaces, interact with vast amounts of text data, and even empower LLMs with the capability to browse the internet for research papers.
https://www.youtube.com/watch?v=zjkBMFhNj_g
PyTorch+
https://datawhalechina.github.io/thorough-pytorch/
PyTorch是利用深度学习进行数据科学研究的重要工具,在灵活性、可读性和性能上都具备相当的优势,近年来已成为学术界实现深度学习算法最常用的框架。
https://www.youtube.com/watch?v=V_xro1bcAuA
Learn PyTorch for deep learning in this comprehensive course for beginners. PyTorch is a machine learning framework written in Python.
深度学习+
https://d2l.ai/
Interactive deep learning book with code, math, and discussions.
Python+
https://liaoxuefeng.com/books/python/introduction/index.html
中文,免费,零起点,完整示例,基于最新的Python 3版本。
https://www.learnpython.org/
a free interactive Python tutorial for people who want to learn Python, fast.
https://www.youtube.com/watch?v=K5KVEU3aaeQ
Master Python from scratch 🚀 No fluff—just clear, practical coding skills to kickstart your journey!
https://www.youtube.com/watch?v=rfscVS0vtbw
This course will give you a full introduction into all of the core concepts in python.
还有更多 •••
相关职位
社招3年以上混元-模型算法技
1.负责大语言模型(LLM)规划、推理、反思能力的研究,提升大语言模型的高阶推理能力; 2.跟进推理领域的前沿技术,将其应用于混元大模型基座,持续提升大模型的推理能力。
更新于 2025-10-31深圳
社招3年以上混元-模型算法技
1.负责大语言模型(LLM)代码理解和生成相关的技术研究,提升大模型的代码基础能力; 2.跟进大模型代码领域的前沿技术,将其应用于研发生产中,持续提升大模型的代码能力; 3.负责大模型的代码相关的数据构建、训练调优及评测迭代,推进大模型技术在代码补全,Text2SQL,代码问答,代码Agent等业务场景落地。
更新于 2026-01-15深圳
校招
参与大语言模型的核心技术研发,包括但不限于: - 预训练优化(数据合成、长上下文建模、训练动态分析) - 后训练技术(强化学习、奖励模型、推理能力提升) - 代码生成与理解(自动化数据构建、运行反馈优化) - 模型架构创新(MoE、高效推理、稳定性优化) - 探索AI Agent、长序列推理、在线学习等新兴方向
更新于 2025-07-09北京
社招2年以上技术类
企业级 AI 方案设计与落地:围绕财务自动化、人力智能决策、法务风险洞察、研发提效等核心场景,主导从 0 → 1 的大模型应用规划、可行性分析与实施。前沿大模型应用研发:深入参与代码生成、AI-BI、企业知识问答、多模态 AIGC(图像 / 文本 / 语音 / 视频)等方向的系统设计与算法优化,推动产品化交付。模型全生命周期训练:负责预训练、指令微调、强化学习(如 DPO/PPO/GRPO)、持续蒸馏等工作,构建可复用的训练pipeline与评测体系,实现模型效果与成本的最优平衡。探索落地最前沿的AI技术:紧跟学术与业界动态,撰写技术洞察、内部分享或对外开源/发表论文,提升团队在大模型领域的影响力。
更新于 2025-08-27深圳