logo of mi

小米高性能计算实习生

实习兼职地点:北京状态:招聘

任职要求


1、熟悉CUDA工作原理,能独立完成代码热点分析并制定优化方案。
2、良好的编程能力,熟悉python,c++,掌握常见的算法和数据结构知识;
3、良好的工程…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1、负责深度学习模型在车载平台上加速和调优,设计基于GPU的高性能算法基础库,支持下游各个算法研发;
2、负责自动驾驶系统的核心算法的实现,配合算法研究员完成算法的落地与部署工作,并在代码与指令集层面优化算法运行效率。
包括英文材料
CUDA+
Python+
C+++
算法+
还有更多 •••
相关职位

logo of kuaishou
社招J1020

1、参与大模型推理/训练优化。通过研发业界领先的AI Compiler 技术,支撑搜推场景在GPU上的训练计算性能优化;支持大模型推理优化技术在异构硬件上的落地; 2、参与各种大模型推理所需的功能性开发任务;相关编译优化功能开发,以图优化、算子融合、GPU高性能算子开发及自动Codegen等技术手段不断推高在不同卡型上的计算性能极限; 3、参与支持日常的大模型推理服务部署,参与内部日常提效工具的研发。

更新于 2025-05-26北京
logo of xiaohongshu
校招引擎

本课题针对百亿级倒排索引的高性能检索需求,研发融合极致压缩算法与LSM Tree磁盘索引的高效倒排索引结构;设计基于异构计算加速、灵活查询DSL和混合存储引擎的检索算法;构建集成多级缓存、秒级实时索引更新和分布式调度的服务框架。 目标是在确保99.9%召回率的基础上,实现毫秒级响应,满足小红书亿级用户的高并发、低延迟检索场景。

更新于 2026-03-25北京|上海|杭州
logo of xiaohongshu
实习客户端开发

深入研究和应用AI大模型技术,对工程架构做全面设计,推动架构智能化升级,确保系统具备高扩展性、高稳定性和高性能,以适应不断变化的业务需求和数据量的增长。

北京|上海|杭州
logo of xiaohongshu
校招机器学习平台

模型压缩方向: 1、探索研发针对大语言模型、多模态大模型、StableDiffusion模型等模型的压缩技术,包括但不限于量化、蒸馏、剪枝、稀疏化等; 2、参与/负责多个业务场景中的模型压缩技术实现,对模型进行轻量化压缩,提高训练/推理效率,支持业务降本增效。 推理框架方向: 1、参与/负责研发面向CV/NLP/多模态/大语言模型等类型模型的推理服务框架; 2、通过并行计算优化、分布式架构优化、异构调度等多种框架技术,打造高效、易用、领先的AI推理框架。 高性能计算方向: 1、参与/负责AI推理/训练框架的底层性能优化工作,包括但不限于高性能算子、通信库开发与优化等工作; 2、参与/负责大模型计算引擎的研发工作,通过多种方式实现训推性能SOTA; 3、参与/负责前沿AI编译加速等技术的探索和业务落地。 模型训练方向: 1、负责调度公司所有模型训练与推理资源; 2、基于自建的训推引擎,构建公司统一的机器学习平台,为公司所有算法同学(稀疏 & 稠密,含 LLM) 模型迭代提供端到端的一站式服务;包括 数据生产,模型训练,模型上线,特征管理,模型测试,资源管控等一系列能力。

北京|上海