小米大模型推理引擎实习生

实习兼职2025-08-28地点：北京状态：招聘

扫码手机上打开

任职要求

1. 本科及以上学历，计算机/电子/信息/通信/自动化/软件等相关专业
2. 掌握Python、C、C++等编程语言，精通数据结构算法，具备优秀的编程习惯
3. 了解CNN、LLM、Transformer、ViT等算法原理
4. 熟悉常见深度学习或LL…

登录查看完整任职要求

微信扫码，1秒登录

工作职责

1. 负责大模型算法在手机、平板等移动设备平台部署，打造业界领先的全平台推理引擎
2. 分析性能瓶颈，提出系统性优化方案，将算法落地到汽车、手机、小爱等集团业务线
3. 设计先进的推理引擎架构，极致优化高性能算子与推理流水线
4. 了解移动端硬件特性，分析推理性能瓶颈，提出系统性解决方案
5. 充分挖掘硬件平台异构算力，优化资源占用
6. 负责AI项目交付、算法库开发、升级优化、技术文档撰写等工作

📮 投递简历 ✨AI模拟面试

难度：

包括英文材料

学历+

Python+

C+

C+++

数据结构+

算法+

编程规范+

CNN+

还有更多 •••

登录查看完整学习资料

相关职位

大模型推理引擎实习生

实习

1. 负责大模型算法在手机、平板等移动设备平台部署，打造业界领先的全平台推理引擎 2. 分析性能瓶颈，提出系统性优化方案，将算法落地到汽车、手机、小爱等集团业务线 3. 设计先进的推理引擎架构，极致优化高性能算子与推理流水线 4. 了解移动端硬件特性，分析推理性能瓶颈，提出系统性解决方案 5. 充分挖掘硬件平台异构算力，优化资源占用 6. 负责AI项目交付、算法库开发、升级优化、技术文档撰写等工作

更新于 2025-12-09北京

大模型推理引擎研发实习生

实习引擎

工作职责： 1、参与/负责研发面向大语言模型(LLM)/多模态大模型(MLLM)等类型模型的推理服务框架； 2、通过并行计算优化、分布式架构优化、异构调度等多种框架技术，打造高效、易用、领先的AI推理框架； 2、深度参与周边深度学习系统多个子方向的工作，包括但不限于模型管理、推理部署、日志/监控、工作流编排等； 3、与全公司各业务算法部门深度合作，为重点项目进行算法与系统的联合优化，支撑业务目标达成。

更新于 2026-02-12北京

27届秋储-AI 推理引擎开发实习生（基础产品事业部）

实习工程-系统类

1、深度参与推理引擎优化工作，包括算子、计算图、内存优化、编译优化等工作 2、深度参与大模型推理服务开发工作。

更新于 2026-05-26北京|杭州

大模型推理研发实习生-豆包大模型

实习A199756

日常实习：面向全体在校生，为符合岗位要求的同学提供为期3个月及以上的项目实践机会。团队介绍：字节跳动豆包大模型团队成立于 2023 年，致力于开发业界最先进的 AI 大模型技术，成为世界一流的研究团队，为科技和社会发展作出贡献。豆包大模型团队在AI领域拥有长期愿景与决心，研究方向涵盖NLP、CV、语音等，在中国、新加坡、美国等地设有实验室和研究岗位。团队依托平台充足的数据、计算等资源，在相关领域持续投入，已推出自研通用大模型，提供多模态能力，下游支持豆包、扣子、即梦等50+业务，并通过火山引擎开放给企业客户。目前，豆包APP已成为中国市场用户量最大的AIGC应用。 1、参与海量大模型异构资源的调度编排、算力池化、弹性资源混布、潮汐资源拆借和Quota管理； 2、参与大模型推理服务的多角色、多阶段、PD分图/EP调度，KVCache centric调度，实现动态、及时、准确的扩缩容管理； 3、参与通过技术手段实现计算资源、RDMA高速网络资源、缓存/存储资源的最优调度，充分发挥大规模分布式集群算力； 4、参与大模型服务的稳定性，通过线上和线下的多系统联动，实现在多种异构资源（GPU、CPU、其他异构硬件）、多云环境、多种网络流量场景的问题定位、诊断、隔离和快速恢复； 5、参与多机房、多地域、多云场景的在离线任务/服务调度，实现负载的合理化分布。

更新于 2025-03-11北京