logo of kuaishou

快手【留用实习】AI性能优化工程师

实习兼职J1020地点:杭州 | 北京状态:招聘

任职要求


1.本科及以上学历,计算机相关专业;
2.在图优化、量化、算子优化等技术方向其中一项有深入研究;
3.熟练掌握C++编程语言,具备扎实的数据结构算法能力,熟悉计算机体系结构和X86汇编,熟悉Python编程;
4.熟悉XLA、MLIR、TVM、Triton、TensorRT等技术之一,并有相应开发经验者优先;
5.熟悉CPU(ARM/x86)或GPU(Intel/Nvidia/AMD)平台的高性能计算优化技术,对计算机体系结构有深入理解,熟悉并行计算优化、访存优化和低比特计算等;
6.了解深度学习算法基本原理,熟悉神经网络基本架构及其算子计算方式,了解至少一种深度学习训练框架及其模型文件解析,如PytorchTensorFlow;
7.有使用GPU做AI算法加速相关经历,熟悉GPU CUDA编程;
8.具有独立解决问题的能力,能够对业务逻辑进行合理的抽象和拆分,具备良好的团队合作精神;
9.了解主流AIGC算法模型原理,具有AIGC模型加速优化经验者优先。

工作职责


1.参与AI与GPU相关项目的性能优化与研发,通过利用CPU、GPU的并行计算优化、架构优化、量化优化和异构调度等高性能优化技术,研发行业领先的高性能异构AI优化技术与编译优化技术;
2.针对搜索、推荐、广告、音视频以及大模型场景,优化模型训练和推理场景的性能;
3.与公司各算法部门深度合作,对重点项目进行算法与系统的联合优化。
包括英文材料
学历+
C+++
数据结构+
算法+
Python+
TensorRT+
深度学习+
PyTorch+
TensorFlow+
CUDA+
相关职位

logo of kuaishou
实习J1020

1、负责依据不同业务场景的特点和新硬件特性,结合系统软硬件栈的整体调优,提出并实施性能优化方案; 2、负责持续跟踪业内软硬件相关领域的技术发展趋势,结合不同业务场景未来需求,开展方案预研以及推广应用工作。 具体包括以下两种场景或者两种之一: 1)AI计算相关场景,例如:大模型训练场景,AIGC、NLP、推荐等常规推理场景; 2)以容器云、大数据计算平台为例的通用计算平台场景。

更新于 2025-03-11
logo of kuaishou
社招J1020

1、参与大模型推理/训练优化。通过研发业界领先的AI Compiler 技术,支撑搜推场景在GPU上的训练计算性能优化;支持大模型推理优化技术在异构硬件上的落地; 2、参与各种大模型推理所需的功能性开发任务;相关编译优化功能开发,以图优化、算子融合、GPU高性能算子开发及自动Codegen等技术手段不断推高在不同卡型上的计算性能极限; 3、参与支持日常的大模型推理服务部署,参与内部日常提效工具的研发。

更新于 2025-05-26
logo of kuaishou
实习J1020

1、负责依据不同业务场景的特点和新硬件特性,结合系统软硬件栈的整体调优,提出并实施性能优化方案; 2、负责持续跟踪业内软硬件相关领域的技术发展趋势,结合不同业务场景未来需求,开展方案预研以及推广应用工作; 具体包括以下三种场景或者三种之一: 1)以容器云、大数据计算平台为例的通用计算平台场景; 2)AI计算相关场景,例如:大模型训练场景,AIGC、NLP、推荐等常规推理场景; 3)结构化以及非结构化数据存储场景。

更新于 2025-03-04
logo of kuaishou
实习J1007

1、参与快手音视频大模型研发,内容包括视频处理大模型/编码大模型。其整体目标是用更少的码率,转出画质更好的视频,从而为用户带来更好的体验,实现压缩即智能; 2、负责点播/直播的处理大模型开发,探索超分等处理大模型算法上限,内容包括网络架构设计和优化,大规模数据处理, Diffusion保真性优化等; 3、负责点播/直播的编码大模型开发,探索AI codec的压缩上限,内容包括压缩网络框架设计和优化,与H.265等传统算法性能评估等; 4、跟踪国内外最新的前沿AI技术,融合处理和编码大模型,为公司研发出下一代基于AI的高效视频转码系统。

更新于 2025-03-18