logo of kuaishou

快手【快Star-X】AI Infra研发工程师

校招全职J1020地点:北京状态:招聘

任职要求


1、本科及以上学历,计算机相关专业;
2、掌握常用数据结构算法,具备扎实的编程基础和良好的编码习惯;
3、熟悉至少一种编程语言(如 GolangJavaPython 等);
4、有 DockerKubernetesvLLMSGLang、RouteLLM 等技术的学习或实践经验者优先,参与过开源项目更佳;  
5、积极主动,自驱力强,具备良好的团队合作精神和解决问题的能力;  
6、对如下一个或多个领域有浓厚的兴趣,并愿意付出自己的时间进行深入研究和探索:
a. 机器学习框架:PyTorchTensorFlow机器学习框架、GPU等异构计算芯片及优化、MLOps、CV/NLP/搜广推等领域模型算法等;
b. 云原生:Kubernetes及容器系统、大规模训练任务和推理服务编排和调度、镜像加速等。

工作职责


1、负责分布式大语言模型 (LLM) 推理系统的底层基础设施研究与探索,包括 GPU 和 RDMA 等,提升 GPU 环境下的稳定性和计算效率;
2、负责大规模模型训练场景优化工作,通过建设全面的异常发现、故障自愈机制,提升平台训练 MFU,降低训练成本;
3、基于容器以及 Kubernetes 技术,负责对机器学习领域中的资源调度、模型训练、模型推理、数据管理等多个子方向的成本效率优化工作;
4、持续关注并跟进业界技术发展,比如超长上下文、思维链、多模态方向。
包括英文材料
学历+
数据结构+
算法+
编程规范+
Go+
Java+
Python+
Docker+
Kubernetes+
vLLM+
SGLang+
机器学习+
PyTorch+
TensorFlow+
NLP+
相关职位

logo of kuaishou
实习J1020

1、研发业界领先的推广搜深度学习训练框架,提供面向大规模稀疏数据的解决方案,服务于快手内部所有推荐类业务场景,包括 短视频、海外、广告、电商、直播等; 2、多样的业务形态和庞大的业务规模使得框架的开发与优化极富挑战性:万量级 GPU 卡,千亿量级样本,万亿量级参数,PB 量级训练数据。

更新于 2025-05-16
logo of xiaohongshu
校招引擎

1. 主导新一代训练与推理引擎的架构设计与核心模块开发,支撑搜广推业务在长序列建模、生成式推荐、Agent 等前沿场景的规模落地。 2. 与存储、数据平台深度协同,打造端到端 ML 数据 Pipeline:统一特征管理、秒级调试、版本追踪与一键上线,让数据科学家专注模型创新。 3. 持续优化训推基础设施:自研 Embedding 高速存储、特征 DSL 引擎、弹性调度与服务化推理框架,实现 10x 级性能提升。 4. 跟踪 LLM / Agent 最新进展,将其工程化落地到搜索、广告、推荐及智能体业务,定义行业新标准。

更新于 2025-09-04
logo of kuaishou
实习J1020

1、参与研发业界领先的深度学习编译技术,落地计算优化、显存优化及分布式优化技术到训练框架和推理框架中,赋能深度学习算法落地; 2、XLA 相关编译优化功能开发; 3、结合pytorch/tensorflow等上下游框架适配与集成; 4、异构大模型推理引擎优化,负责调研NV 上各种推理引擎的优化技术,并支持大模型推理各种优化技术在异构硬件上的落地。

更新于 2025-05-14
logo of kuaishou
校招J1020

1、参与大模型推理/训练优化。通过研发业界领先的AI Compiler 技术,支撑搜推场景在GPU上的训练计算性能优化;支持大模型推理优化技术在异构硬件上的落地; 2、参与各种大模型推理所需的功能性开发任务;相关编译优化功能开发,以图优化、算子融合、GPU高性能算子开发及自动Codegen等技术手段不断推高在不同卡型上的计算性能极限; 3、参与支持日常的大模型推理服务部署,参与内部日常提效工具的研发。

更新于 2025-07-22