logo of alibaba

阿里巴巴算法工程师-大语言模型(代码研发 & 端侧模型)(T-Star Lab 日常实习)

实习兼职淘天集团T-Star日常实习生地点:杭州状态:招聘

任职要求


1. 计算机科学、人工智能、机器学习或相关领域专业、研究方向,硕士及以上学历在校生。
2. 在自然语言、LLM大模型、多模态大模型大模型轻量化等相关领域的研究研发经验。
3. 具备出色的编程能力,熟练掌握Pytorch深度学习框架和Python编程语言。
4. 敢于…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


核心职责与研究课题:
1.  研发垂域大模型:面向淘宝复杂工程技术体系,构建懂淘宝上下文的研发垂域大模型。
①设计面向复杂工程系统的大模型数据构建和训练策略,涵盖离线的研发数据的高质量组织与清洗、在线人机协同的用户轨迹数据组织与迭代、算法训练方式策略选择(CPT、SFT、RL/RLHF)等;
②攻克研发场景的大模型面临的工程系统关系理解、研发领域知识显式记忆与推理、研发域差异化任务规划及工具调用、及情景感知检索等方向难题,打造懂业务、懂架构的研发智能体能力。

2.  端侧大模型探索:结合淘宝开源端侧深度推理引擎 MNN,探索极致高效的端侧大模型技术。
①摒弃单纯的模型压缩思路,以端侧NPU/CPU/GPU 的硬件特性牵引大模型架构设计,探索并设计适合端侧运行的高效模型架构,在有限算力下突破性能瓶颈;
②负责端侧模型的全流程训练探索,涉及从预训练及后训练优化,结合投机采样、KV Cache优化、混合量化等优化,得到高性能的端侧大模型。

T-Star实习可以带给你什么?
① 加入前沿技术探索队伍,参与顶级课题研究,有机会实现工业界项目落地。
② 跟企业大牛导师/学术界名导一起做有价值的课题。
③ 丰富的技术资源、海量的数据与优秀的团队助力发paper。
包括英文材料
机器学习+
学历+
大模型+
PyTorch+
深度学习+
Python+
还有更多 •••
相关职位

logo of xiaohongshu
社招5-10年引擎

我们是小红书中台大模型 Infra 团队,专注打造领先易用的「AI 大模型全链路基础设施」!团队深耕大模型「数-训-压-推-评」技术闭环,在大模型训练加速、模型压缩、推理优化、部署提效等方向积累了深厚的技术优势,基于 RedAccel 训练引擎、RedSlim 压缩工具、RedServing 推理部署引擎、DirectLLM 大模型 API 服务、QuickSilver 大模型生产部署平台等核心产品,持续赋能社区、商业、交易、安全、数平、研效等多个核心业务,实现 AI 技术高效落地! 工作职责: 1、参与/负责研发面向大语言模型(LLM)/多模态大模型(MLLM)等类型模型的推理服务框架; 2、参与/负责KV Router、PD分离/EPD分离、KVCache管理、动态PD调整等分布式推理能力建设; 3、通过并行计算优化、分布式架构优化、异构调度等多种框架技术,打造高效、易用、领先的AI推理框架; 4、参与/负责构建推理框架的系统容错能力,包括但不限于请求迁移、优雅退出、故障检测、自愈等能力建设; 5、深度参与周边深度学习系统多个子方向的工作,包括但不限于模型管理、推理部署、日志/监控、工作流编排等; 6、与全公司各业务算法部门深度合作,为重点项目进行算法与系统的联合优化,支撑业务目标达成。

更新于 2026-03-28北京|上海
logo of ke
社招5年以上用户技术中心

岗位职责: 1、负责 AI Agent 系统的设计、开发和优化、开发和完善基于大语言模型 (LLM) 的智能体系统,提升 Agent 的自主决策和任务执行能力; 2、负责生成式大模型指令意图理解相关工作,整体提升大模型的多轮对话指令理解能力和性能; 3、设计并实现 Agent 的工具使用接口,实现与各类外部系统和 API 的集成编排; 4、负责大模型在检索、推荐方面的系统设计实现和优化,探索Agent、RAG、领域模型调优等相关技术在业务场景落地; 5、具备模型知识、幻觉机制探究,提升模型知识水平、降低模型幻觉率; 6、能够基于开源模型,设计和开发算法,对模型进行微调,优化其参数和结构,以提高模型的泛化能力和准确性; 7、深入调研AI领域相关的前沿技术,跟踪业内大模型领域的最新进展,并寻求将最新技术应用到产品的可能性。

更新于 2025-04-02北京
logo of antgroup
社招3年以上技术类-开发

我们是蚂蚁集团网络技术团队,为蚂蚁集团全站提供通智一体、稳定高效的网络基础设施产品、平台和服务。 ● 负责推理网关核心能力设计和开发; ● 通过创新的流量调度算法减少推理成本;

更新于 2025-04-03北京|杭州|成都
logo of bytedance
社招A191024

1、负责音乐相关业务的大语言模型的研发和应用,相关研发技术和解决方案在抖音、汽水音乐等产品中应用,满足音乐相关业务场景中的用户不断增长的智能交互需求,全面提升用户在音乐相关的创作和消费场景的体验; 2、参与音乐相关大模型的研发,如音乐预训练、音乐多模态模型等; 3、参与大模型技术在音乐场景中的探索和相关应用落地,如音乐搜推、音乐助手、视频配乐等; 4、在音乐人工智能领域开展前沿研究,在未来生活中的更多音乐相关的使用场景的深入研究和探索。

更新于 2025-03-17北京