阿里巴巴算法工程师-大语言模型（代码研发 & 端侧模型）（T-Star Lab 日常实习）

实习兼职淘天集团T-Star日常实习生2026-01-21地点：杭州状态：招聘

扫码手机上打开

任职要求

1. 计算机科学、人工智能、机器学习或相关领域专业、研究方向，硕士及以上学历在校生。
2. 在自然语言、LLM大模型、多模态大模型、大模型轻量化等相关领域的研究研发经验。
3. 具备出色的编程能力，熟练掌握Pytorch等深度学习框架和Python编程语言。
4. 敢于…

登录查看完整任职要求

微信扫码，1秒登录

工作职责

核心职责与研究课题：
1.  研发垂域大模型：面向淘宝复杂工程技术体系，构建懂淘宝上下文的研发垂域大模型。
①设计面向复杂工程系统的大模型数据构建和训练策略，涵盖离线的研发数据的高质量组织与清洗、在线人机协同的用户轨迹数据组织与迭代、算法训练方式策略选择（CPT、SFT、RL/RLHF）等；
②攻克研发场景的大模型面临的工程系统关系理解、研发领域知识显式记忆与推理、研发域差异化任务规划及工具调用、及情景感知检索等方向难题，打造懂业务、懂架构的研发智能体能力。

2.  端侧大模型探索：结合淘宝开源端侧深度推理引擎 MNN，探索极致高效的端侧大模型技术。
①摒弃单纯的模型压缩思路，以端侧NPU/CPU/GPU 的硬件特性牵引大模型架构设计，探索并设计适合端侧运行的高效模型架构，在有限算力下突破性能瓶颈；
②负责端侧模型的全流程训练探索，涉及从预训练及后训练优化，结合投机采样、KV Cache优化、混合量化等优化，得到高性能的端侧大模型。

T-Star实习可以带给你什么？
① 加入前沿技术探索队伍，参与顶级课题研究，有机会实现工业界项目落地。
② 跟企业大牛导师/学术界名导一起做有价值的课题。
③ 丰富的技术资源、海量的数据与优秀的团队助力发paper。

📮 投递简历 ✨AI模拟面试

难度：

包括英文材料

机器学习+

学历+

大模型+

PyTorch+

深度学习+

Python+

还有更多 •••

登录查看完整学习资料

相关职位

算法工程师-大语言模型

校招阿里控股2026

具体职责包括但不限于： 1. 负责自然语言处理尤其是大模型领域的前沿技术创新研发；推动语言模型、知识表示、机器翻译、长思维链推理、对话系统、文本生成等关键技术和核心问题的解决，形成高引用论文和高价值专利，积极探索相关技术落地应用； 2. 负责追踪最新技术和热点，优化、改进现有技术和系统，提升系统的性能和效率，在内外部业务场景验证，形成业内领先的技术服务能力和体系； 3. 负责业务技术需求的支持，针对业务场景的真实需求，设计合理的技术方案和路线，通过技术创新和业务验证，实现业务价值和效率的提升。

更新于 2026-04-14北京|杭州

算法工程师-大语言模型

实习阿里巴巴2027

1. 负责自然语言处理尤其是大模型领域的前沿技术创新研发；推动语言模型、知识表示、机器翻译、长思维链推理、对话系统、文本生成等关键技术和核心问题的解决，形成高引用论文和高价值专利，积极探索相关技术落地应用； 2. 负责追踪最新技术和热点，优化、改进现有技术和系统，提升系统的性能和效率，在内外部业务场景验证，形成业内领先的技术服务能力和体系； 3. 负责业务技术需求的支持，针对业务场景的真实需求，设计合理的技术方案和路线，通过技术创新和业务验证，实现业务价值和效率的提升。

更新于 2026-03-17北京|杭州

算法工程师-大语言模型

实习数据与算法类

1. 与各业务、产品、工程团队配合，在京东亿量级的数据与丰富的业务应用场景中不断进行深入的自然语言处理的算法研发，包括但不限于语义分析、意图识别、智能对话、语义挖掘、机器翻译、知识图谱、语言模型、语言生成等方面； 2. 参与到京东自然语言处理的相关业务场景中，包括但不限于文本内容理解、智能对话的语义解析及意图理解、商品评价的语义理解、内容搜索推荐的结构化分析、商品搜索推荐的标签体系、社会化问答的文本分析及社交媒体数据情感分析、智能客服、商品营销文案生成等内容； 3. 与京东的技术团队及科学家们一同参与人工智能和自然语言处理及应用的前沿研究，助力业务提升效率，实现京东技术愿景和战略； 4. AI应用探索：积极跟踪NLP领域大模型等前沿技术，熟练运用AI开发工具及框架提升模型训练、评估与部署效率，推动创新应用落地。

更新于 2024-03-01北京|上海

AI算法工程师（大语言模型/图形学/语音生成方向）

校招程序技术类

负责游戏研发/运营过程中的相关研发与应用工作；跟踪领域前沿技术，提升技术上限、落地游戏领域相关业务，包括： ①语音生成方向：负责语音生成相关算法能力研发和优化，包括但不限于高表现力语音合成、音色转换、生成模型等； ②图形学方向：负责多模态内容自动生成的研发与应用工作，包括但不限于2D/3D/动画的生成与处理；针对多模态内容生成的研发与应用，构建相关数据及所需工具，并搭建工作流程； ③大语言模型方向：负责游戏研发/运营过程中大语言模型研发与应用工作，包括但不限于基于LLM对游戏研发流程进行优化及对玩法进行创新；针对LLM的研发与应用，构建相关数据及所需工具，并搭建工作流程；

上海