logo of kuaishou

快手【留用实习】编译器研发工程师

实习兼职J1014地点:深圳 | 杭州 | 北京状态:招聘

任职要求


1、本科及以上学历,计算机相关专业;
2、熟练掌握C/C++语言,熟悉汇编优先;
3、熟悉主流编译器GCC/LLVM的基本原理优先;
4、了解计算机体系结构、CPU微架构优先;
5、 有强烈的技术热情,工作责任感强;具备良好的沟通能力。

工作职责


1、负责快手C++编译构建系统及编译性能优化技术的研发;
2、解决C++编译耗时劣化问题、优化业务运行性能,提升研发效率及降低服务运行成本。
包括英文材料
学历+
C+
C+++
GCC+
LLVM+
相关职位

logo of kuaishou
实习J1020

1、参与研发业界领先的深度学习编译技术,落地计算优化、显存优化及分布式优化技术到训练框架和推理框架中,赋能深度学习算法落地; 2、XLA 相关编译优化功能开发; 3、结合pytorch/tensorflow等上下游框架适配与集成; 4、异构大模型推理引擎优化,负责调研NV 上各种推理引擎的优化技术,并支持大模型推理各种优化技术在异构硬件上的落地。

更新于 2025-05-14
logo of kuaishou
实习J1020

1、负责硬件性能测试,操作系统与硬件兼容性,稳定性测试; 2、负责大规模服务器硬件监控系统的开发与优化; 3、负责整体服务器计算系统、存储系统、高性能计算系统、高速互联系统的设计、开发、优化工作; 4、负责开发匹配超大规模分布式平台的计算硬件系统、存储硬件系统、高速互联架构及硬件产品; 5、负责开发性能分析方法与平台,软硬件一体化系统架构设计; 6、负责部件定制化研究,不限于CPU、SSD; 7、负责X86、AMD、ARM等不同芯片架构的跨平台应用移植与性能优化。

更新于 2025-03-04
logo of kuaishou
实习J1020

1、负责依据不同业务场景的特点和新硬件特性,结合系统软硬件栈的整体调优,提出并实施性能优化方案; 2、负责持续跟踪业内软硬件相关领域的技术发展趋势,结合不同业务场景未来需求,开展方案预研以及推广应用工作。 具体包括以下两种场景或者两种之一: 1)AI计算相关场景,例如:大模型训练场景,AIGC、NLP、推荐等常规推理场景; 2)以容器云、大数据计算平台为例的通用计算平台场景。

更新于 2025-03-11
logo of kuaishou
社招J1020

1、参与大模型推理/训练优化。通过研发业界领先的AI Compiler 技术,支撑搜推场景在GPU上的训练计算性能优化;支持大模型推理优化技术在异构硬件上的落地; 2、参与各种大模型推理所需的功能性开发任务;相关编译优化功能开发,以图优化、算子融合、GPU高性能算子开发及自动Codegen等技术手段不断推高在不同卡型上的计算性能极限; 3、参与支持日常的大模型推理服务部署,参与内部日常提效工具的研发。

更新于 2025-05-26