logo of kuaishou

快手AI性能优化工程师

校招全职J1020地点:深圳 | 杭州 | 北京状态:招聘

任职要求


1.本科及以上学历,计算机相关专业;
2.在图优化、量化、算子优化等技术方向其中一项有深入研究;
3.熟练掌握C++编程语言,具备扎实的数据结构算法能力,熟悉计算机体系结构和X86汇编,熟悉Python编程;
4.熟悉XLA、MLIR、TVM、Triton、TensorRT等技术之一,并有相应开发经验者优先;
5.熟悉CPU(ARM/x86)或GPU(Intel/Nvidia/AMD)平台的高性能计算优化技术,对计算机体系结构有深…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1.参与AI与GPU相关项目的性能优化与研发,通过利用CPU、GPU的并行计算优化、架构优化、量化优化和异构调度等高性能优化技术,研发行业领先的高性能异构AI优化技术与编译优化技术;
2.针对搜索、推荐、广告、音视频以及大模型场景,优化模型训练和推理场景的性能;
3.与公司各算法部门深度合作,对重点项目进行算法与系统的联合优化。
包括英文材料
学历+
C+++
数据结构+
算法+
Python+
还有更多 •••
相关职位

logo of kuaishou
社招D7198

1.参与AI与GPU相关项目的性能优化与研发,通过利用并行计算优化、架构优化、量化优化和异构调度等高性能优化技术,研发行业领先的高性能异构AI优化技术与编译优化技术; 2.针对搜广推、音视频以及大模型场景,优化大模型训练和推理场景的性能; 3.与公司各算法部门深度合作,对重点项目进行算法与系统的联合优化。

更新于 2025-04-10北京
logo of kuaishou
实习J1020

1.参与AI与GPU相关项目的性能优化与研发,通过利用CPU、GPU的并行计算优化、架构优化、量化优化和异构调度等高性能优化技术,研发行业领先的高性能异构AI优化技术与编译优化技术; 2.针对搜索、推荐、广告、音视频以及大模型场景,优化模型训练和推理场景的性能; 3.与公司各算法部门深度合作,对重点项目进行算法与系统的联合优化。

更新于 2025-03-31杭州|北京
logo of tencent
社招TEG技术

1.基于自研芯片,研发高性能推理与训练框架,解决芯片落地过程中的全链路问题; 2.根据市场产品调研,不断优化自身瓶颈,全面提升自研芯片推理模型整网性能; 3.不断迭代和完善框架性能和易用性,和业务一起构建自研芯片软件生态。

更新于 2025-06-18深圳
logo of tencent
社招TEG技术

1.基于自研芯片,研发高性能推理与训练框架,解决芯片落地过程中的全链路问题; 2.根据市场产品调研,不断优化自身瓶颈,全面提升自研芯片推理模型整网性能; 3.不断迭代和完善框架性能和易用性,和业务一起构建自研芯片软件生态。

更新于 2025-05-21北京