logo of kuaishou

快手【留用实习】AI Infra研发工程师

实习兼职J1020地点:杭州状态:招聘

任职要求


1. 本科及以上学历,计算机相关专业;
2. 掌握常用数据结构算法,具备扎实的编程基础和良好的编码习惯;
3. 熟悉至少一种编程语言(如 GolangJavaPython 等); 
4. 有 DockerKubernetesvLLM、SGLang、RouteLLM 等技术的学习或实践经验者优先,参与过开源项目更佳;  
5. 积极主动,自驱力强,具备良好的团队合作精神和解决问题的能力;  
6. 对如下一个或多个领域有浓厚的兴趣,并愿意付出自己的时间进行深入研究和探索:
	a. 机器学习框架:PyTorchTensorFlow机器学习框架、GPU等异构计算芯片及优化、MLOps、CV/NLP/搜广推等领域模型算法等;
	b. 云原生:Kubernetes及容器系统、大规模训练任务和推理服务编排和调度、镜像加速等;

工作职责


1. 负责分布式大语言模型 (LLM) 推理系统的底层基础设施研究与探索,包括 GPU 和 RDMA 等,提升 GPU 环境下的稳定性和计算效率;
2. 负责大规模模型训练场景优化工作,通过建设全面的异常发现、故障自愈机制,提升平台训练 MFU,降低训练成本;
3. 基于容器以及 Kubernetes 技术,负责对机器学习领域中的资源调度、模型训练、模型推理、数据管理等多个子方向的成本效率优化工作;
4. 持续关注并跟进业界技术发展,比如超长上下文、思维链、多模态方向;
包括英文材料
学历+
数据结构+
算法+
编程规范+
Go+
Java+
Python+
Docker+
Kubernetes+
vLLM+
机器学习+
PyTorch+
TensorFlow+
NLP+
相关职位

logo of kuaishou
实习J1020

1、研发业界领先的推广搜深度学习训练框架,提供面向大规模稀疏数据的解决方案,服务于快手内部所有推荐类业务场景,包括 短视频、海外、广告、电商、直播等; 2、多样的业务形态和庞大的业务规模使得框架的开发与优化极富挑战性:万量级 GPU 卡,千亿量级样本,万亿量级参数,PB 量级训练数据。

更新于 2025-05-16
logo of kuaishou
实习J1020

1、参与研发业界领先的深度学习编译技术,落地计算优化、显存优化及分布式优化技术到训练框架和推理框架中,赋能深度学习算法落地; 2、XLA 相关编译优化功能开发; 3、结合pytorch/tensorflow等上下游框架适配与集成; 4、异构大模型推理引擎优化,负责调研NV 上各种推理引擎的优化技术,并支持大模型推理各种优化技术在异构硬件上的落地。

更新于 2025-05-14
logo of kuaishou
社招J1020

1、参与大模型推理/训练优化。通过研发业界领先的AI Compiler 技术,支撑搜推场景在GPU上的训练计算性能优化;支持大模型推理优化技术在异构硬件上的落地; 2、参与各种大模型推理所需的功能性开发任务;相关编译优化功能开发,以图优化、算子融合、GPU高性能算子开发及自动Codegen等技术手段不断推高在不同卡型上的计算性能极限; 3、参与支持日常的大模型推理服务部署,参与内部日常提效工具的研发。

更新于 2025-05-26
logo of kuaishou
实习J1020

1、负责研发快手的机器学习平台,作为公司级的平台,支撑了包括推荐、广告、搜索等核心业务的算法迭代; 2、通过自研大数据引擎,构建特征工程领域的高性能计算存储框架和统一开发平台,支持算法团队的研发效率; 3、重点研究海量数据的存储与传输格式,分布式计算框架,算法DSL语言,TaskFlow 等技术,不断优化模型工程的系统效率。

更新于 2025-05-20