小米训练平台性能优化工程师实习生
实习兼职地点:北京状态:招聘
任职要求
1.精通深度学习训练加速技术,熟悉分布式训练框架设计 2.掌握CUDA编程及GPU性能分析工具(Nsight/Profiler) 3.熟练使用PyTorch框架,具备训练流程优化实战经验 4.熟悉常见模型压缩技术(量化/剪枝/…
登录查看完整任职要求
微信扫码,1秒登录
工作职责
深度优化训练流程
主导模型训练全链路性能分析与优化,设计GPU资源弹性调度策略
开发自动化训练加速工具链,构建可扩展的云端训练框架
研发混合精度训练、梯度压缩等前沿技术,突破训练吞吐瓶颈
构建训练优化体系
制定标准化训练效能评估体系,建立成本-效率量化模型
设计可复用的训练加速组件库,沉淀最佳实践方法论
开发训练过程性能分析平台,实现性能问题智能诊断
赋能业务研发
优化多任务资源调度策略,提升GPU集群整体利用率
为算法团队提供训练加速解决方案,缩短模型迭代周期包括英文材料
深度学习+
https://d2l.ai/
Interactive deep learning book with code, math, and discussions.
CUDA+
https://developer.nvidia.com/blog/even-easier-introduction-cuda/
This post is a super simple introduction to CUDA, the popular parallel computing platform and programming model from NVIDIA.
https://www.youtube.com/watch?v=86FAWCzIe_4
Lean how to program with Nvidia CUDA and leverage GPUs for high-performance computing and deep learning.
还有更多 •••
相关职位
实习
深度优化训练流程 主导模型训练全链路性能分析与优化,设计GPU资源弹性调度策略 开发自动化训练加速工具链,构建可扩展的云端训练框架 研发混合精度训练、梯度压缩等前沿技术,突破训练吞吐瓶颈 构建训练优化体系 制定标准化训练效能评估体系,建立成本-效率量化模型 设计可复用的训练加速组件库,沉淀最佳实践方法论 开发训练过程性能分析平台,实现性能问题智能诊断 赋能业务研发 优化多任务资源调度策略,提升GPU集群整体利用率 为算法团队提供训练加速解决方案,缩短模型迭代周期
更新于 2026-01-20北京
实习前端开发
1、参与小红书内部AI平台QuickSilver的前端开发工作,高质量完成前端功能开发和组件建设; 2、与产品、后端、算法紧密合作,完成数据管理、模型管理、模型训练、压缩、推理、部署、资源调度等功能; 3、设计和实现前端交互界面,优化页面性能与交互体验,提升平台的易用性和美观性; 4、参与前端技术预研,关注大模型开发平台产品现状,了解业界领先的产品和交互设计;
更新于 2025-11-04北京