logo of mi

小米顶尖应届-端侧AI算法分析研究工程师-手机

校招全职地点:北京状态:招聘

任职要求


1. Python/PyTorch 编程专家;
2. 出色的沟通和写作能力;
3. 计算机科学/计算机工程或相关领域的硕士、博士。

加分项经验
1. 具有端侧AI性能、精度优化经验;
2. 具有大规模模型训练/调整经验;
3. 具有后端编译、软硬件协同设计和/或性能优化经验;
4. 了解 AI 加速和架构;
5. 了解 CUDA/GPU 和编程;
6. 了解 NPU 编译器、微架构、性能优化方法。

工作职责


概括
想象一下您在这里能做什么!
在小米,新想法可以很快变成非凡的产品、服务和客户体验。
对工作充满真诚热爱,您将取得的成就前所未有。
充满活力、勤奋的员工和鼓舞人心的创新技术是这里的常态。
在这里工作的人通过小米的硬件和软件产品影响整个行业。
加入我们,帮助推出下一个突破性的小米产品。
本团队正在开展小米AI领域的硬件/软件协同设计创新,以实现高效AI推理
我们正在寻找一位积极主动的研究工程师加入我们的团队,他/她应具有强大的AI系统背景和软件开发实践经验。
该职位的理想人选是一位研究人员和工程师,他/她将不断突破现有界限,并以影响小米内部外部合作伙伴和更广泛的研究社区来实现设想。


描述
1. 构造与竞争对手的量化比较的测试模型和制定合理合理的KPI;
2. 量化度量AI算法流程中的负载、瓶颈点,并且可视化的呈现结果;
3. 研究和开发 关键业务的AI算法、推理速度优化方法,实现高效的端侧AI,包括但不限于 Vision、NLP、OCR、LLM;
4. 与算法开发团队、AI芯片团队合作,将工作成果产品化;
5. 逐步优化改进最终实现端侧AI领域的技术领先。

【课题名称】
端侧AI算法分析研究
【课题内容】
1. 从用户场景出发,分析手机上用户需求,设计和开发合理的AI特性来满足用户诉求;
2. 对流程、架构、算法进行优化,达到本芯片最优化,并且优化iOS等竞争对手。
包括英文材料
Python+
PyTorch+
CUDA+
相关职位

logo of mi
校招

1、创新应用和模型结构分析和建模:对新MoE模型,Transformer优化模型,非Transformer模型,语音模型,视觉模型进行计算特征,访存特征,通信特征分析建模; 2、推理系统优化技术:基于应用特征,自顶向下分析推理软件栈可优化手段,从推理调度,KV Cache管理,推理引擎,算子,并行切进行协同优化; 3、模型压缩:探索低精度损失的低比特量化(如INT4/INT2量化)或稀疏化等算法,缓解大模型推理计算与内存开销; 4、长序列优化:通过序列压缩、序列并行等算法,在有限的部署资源上(如单机)实现1M甚至10M长序列高效推理; 5、提供高性能轻量级AI推理引擎:分析当前CPU执行AI推理的性能瓶颈,通过先进AI算法技术(比如Sparsicity等)和编译优化技术(auto-tiling等),结合BW芯片众核、大带宽、高矢量的架构特征,挑战性能天花板,推动AI4Compiler技术切实落地。 【课题名称】 大模型负载分析和推理系统优化。 【课题内容】 结合端侧设备的功耗、面积和实时性限制,探索自动优化方法研究,沉淀算子、模型及应用级优化方法,识别加速最优解决方案,并能够实施自动化化优化技术研究&应用。实现计算过程中的高效协同,发挥各类计算单元的有效算力;在算力墙、内存墙、通信墙等各维度平衡取舍发挥系统综合最优性能。

更新于 2025-07-23
logo of mi
校招

前沿技术研究 1. 跟踪全球手机领域的前沿软件技术动态(如操作系统优化、基础软件优化、硬件协同创新、端侧AI系统优化等),分析技术趋势并输出研究报告; 2. 深入研究学术界顶会论文(如OSDI/SOSP/FAST/NSDI/SIGCOMM/ASPLOS/CGO/ICSE等),提炼可落地的技术方案,推动技术预研与创新。 竞争洞察与行业分析 1. 监测友商技术动态,评估其技术路线、专利布局及产品实现,为小米技术战略提供决策支持。 PoC概念验证开发 1. 对于高价值关键技术点的原型开发,完成算法优化、性能测试及可行性验证,推动创新成果向实际产品转化。 跨领域协同 1. 与OS、硬件、AI、自动驾驶等团队合作,探索手机与智能生态(IoT、汽车、机器人)的软件技术融合方案。 技术成果输出 1. 撰写高质量学术论文,申请技术专利,参与行业技术标准制定,提升小米在学术界和产业界的影响力。 【课题名称】 下一代操作系统研究 【课题内容】 1.前沿技术探索 a. 研究基础软件领域,如操作系统轻量化内核架构(如Unikernel混合部署模型)、编译器与AI融合优化(MLIR动态代码生成)、低损耗容错中间件等关键技术; b. 研究系统关键模块(调度系统/内存管理/驱动框架/协议栈)的创新机会,如形式化验证驱动的确定性高稳定协议栈。 2. PoC验证与落地转化 a. 针对高潜力方向(如编译时-运行时联合优化、异构资源池化调度),在原型系统完成技术可行性验证。

更新于 2025-06-26
logo of mi
校招

1. 围绕终端天线的关键开发活动,完成需求分析与效率瓶颈定位; 2. 通过算法与工具开发,构建自动化的全栈工具链,形成可标准化、可扩展的提效体系; 3. 建立数据反馈机制,监控分析过程数据,实现迭代优化和扩展应用; 4. 形成技术资产沉淀,标准化推广运作和内部培训。 【课题名称】 天线自动化调优与分析的提效平台优化和应用 【课题内容】 1. 构建一套覆盖天线设计、调优、分析的自动化工具链,解决传统人工操作效率低、经验依赖性强的问题,长期围绕AI提效的理念横向扩展; 2. 研究包括但不限于以下方向:FPC天线自动化调优、有源器件参数自动化配置、场测Log数据智能分析等; 3. 匹配业务开发流程,实现核心算法开发与端到端的自动化Demo(从参数生成到实测验证); 4. 透过试点项目的运作,量化研发提效逻辑,实现地域特色能力扩圈; 5. 透过过程数据分析,挖掘潜在的深层次扩展应用,如识别设计边界,基础规律,数据间的隐含关联性等。

更新于 2025-06-25
logo of mi
校招

1. 负责移动端图形系统的功能开发以及渲染方向的规划; 2. 负责移动端图形领域竞争力构建,端侧图形业务相关的架构和算法实现; 3. 负责系统图形渲染链路的性能分析,以及游戏GPU效果优化,满足用户对高画质、低功耗的需求; 4. 手机游戏优化GPU图形渲染方向,软硬件和平台技术规划。 【课题名称】 下一代图形渲染&人机交互技术研究 【课题内容】 1. 图形算法研究,在游戏/3D图形表现上达到行业领先水准; 2. 游戏图形优化,在功耗、画质、流畅性领先行业; 3. 下一代3D渲染架构预研和开发; 4. GPU/外挂芯片架构优化和功能设计; 5. 游戏和交互式场景下人工智能新应用的技术突破。

更新于 2025-06-26