logo of alibaba

阿里巴巴算法工程师-大语言模型(代码研发 & 端侧模型)(T-Star Lab 日常实习)

实习兼职淘天集团T-Star日常实习生地点:杭州状态:招聘

任职要求


1. 计算机科学、人工智能、机器学习或相关领域专业、研究方向,硕士及以上学历在校生。
2. 在自然语言、LLM大模型、多模态大模型大模型轻量化等相关领域的研究研发经验。
3. 具备出色的编程能力,熟练掌握Pytorch深度学习框架和Python编程语言。
4. 敢于…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


核心职责与研究课题:
1.  研发垂域大模型:面向淘宝复杂工程技术体系,构建懂淘宝上下文的研发垂域大模型。
①设计面向复杂工程系统的大模型数据构建和训练策略,涵盖离线的研发数据的高质量组织与清洗、在线人机协同的用户轨迹数据组织与迭代、算法训练方式策略选择(CPT、SFT、RL/RLHF)等;
②攻克研发场景的大模型面临的工程系统关系理解、研发领域知识显式记忆与推理、研发域差异化任务规划及工具调用、及情景感知检索等方向难题,打造懂业务、懂架构的研发智能体能力。

2.  端侧大模型探索:结合淘宝开源端侧深度推理引擎 MNN,探索极致高效的端侧大模型技术。
①摒弃单纯的模型压缩思路,以端侧NPU/CPU/GPU 的硬件特性牵引大模型架构设计,探索并设计适合端侧运行的高效模型架构,在有限算力下突破性能瓶颈;
②负责端侧模型的全流程训练探索,涉及从预训练及后训练优化,结合投机采样、KV Cache优化、混合量化等优化,得到高性能的端侧大模型。

T-Star实习可以带给你什么?
① 加入前沿技术探索队伍,参与顶级课题研究,有机会实现工业界项目落地。
② 跟企业大牛导师/学术界名导一起做有价值的课题。
③ 丰富的技术资源、海量的数据与优秀的团队助力发paper。
包括英文材料
机器学习+
学历+
大模型+
PyTorch+
深度学习+
Python+
还有更多 •••
相关职位

logo of tencent
社招3年以上混元-模型算法技

1.负责大语言模型(LLM)规划、推理、反思能力的研究,提升大语言模型的高阶推理能力; 2.跟进推理领域的前沿技术,将其应用于混元大模型基座,持续提升大模型的推理能力。

更新于 2025-10-31深圳
logo of tencent
社招3年以上混元-模型算法技

1.负责大语言模型(LLM)代码理解和生成相关的技术研究,提升大模型的代码基础能力; 2.跟进大模型代码领域的前沿技术,将其应用于研发生产中,持续提升大模型的代码能力; 3.负责大模型的代码相关的数据构建、训练调优及评测迭代,推进大模型技术在代码补全,Text2SQL,代码问答,代码Agent等业务场景落地。

更新于 2026-01-15深圳
logo of mi
校招

参与大语言模型的核心技术研发,包括但不限于: - 预训练优化(数据合成、长上下文建模、训练动态分析) - 后训练技术(强化学习、奖励模型、推理能力提升) - 代码生成与理解(自动化数据构建、运行反馈优化) - 模型架构创新(MoE、高效推理、稳定性优化) - 探索AI Agent、长序列推理、在线学习等新兴方向

更新于 2025-07-09北京
logo of futu
社招2年以上技术类

企业级 AI 方案设计与落地:围绕财务自动化、人力智能决策、法务风险洞察、研发提效等核心场景,主导从 0 → 1 的大模型应用规划、可行性分析与实施。前沿大模型应用研发:深入参与代码生成、AI-BI、企业知识问答、多模态 AIGC(图像 / 文本 / 语音 / 视频)等方向的系统设计与算法优化,推动产品化交付。模型全生命周期训练:负责预训练、指令微调、强化学习(如 DPO/PPO/GRPO)、持续蒸馏等工作,构建可复用的训练pipeline与评测体系,实现模型效果与成本的最优平衡。探索落地最前沿的AI技术:紧跟学术与业界动态,撰写技术洞察、内部分享或对外开源/发表论文,提升团队在大模型领域的影响力。

更新于 2025-08-27深圳