logo of kuaishou

快手【留用实习】异构计算平台优化工程师

实习兼职J1020地点:上海 | 北京状态:招聘

任职要求


1、本科及以上学历,深入理解处理器体系结构(X86/ARM)或者常见GPGPU/NPU系统架构,了解CPU/GPU微架构、PMU等相关子领域;
2、对AI领域的基本理论与常见模型算法有深刻理解,熟练使用tensorflowpytorch进行模型训练或tensorrt/tvm做推理优化,对使用GPU做AI算法加速有相关经历,熟悉GPU CUDA编程;
3、深入理解操作系统架构和实现原理,熟练掌握问题定位手段(perf、SystemTap、eBPF),精通软硬件系统性能分析及优化;
4、熟悉Linux kernel、虚拟化系统(KVM/QEMU/VirtIO)、内存管理、进程管理、I/O软件栈;
5、熟悉数据中心常见平台软件维护开发,例如:K8sHadoop/Spark,分布式存储(CephFS/HDFS)或存储引擎(InnoDB/RocksDB);
6、具备较强的逻辑思考能力、沟通能力、学习能力、合作精神,积极主动,有责任心,抗压性强。

加分项:
1、有GPU/NPU上的AI编译器/算子加速库/集合通信库开发经验;
2、有CPU/GPU模拟器/C-module开发经验;
3、熟悉新型硬件,有智能板卡、控制器固件、驱动、Open Channel、SPDK、DPDK等研发和应用经验。

工作职责


1、负责依据不同业务场景的特点和新硬件特性,结合系统软硬件栈的整体调优,提出并实施性能优化方案;
2、负责持续跟踪业内软硬件相关领域的技术发展趋势,结合不同业务场景未来需求,开展方案预研以及推广应用工作。

具体包括以下两种场景或者两种之一:
1)AI计算相关场景,例如:大模型训练场景,AIGC、NLP、推荐等常规推理场景;
2)以容器云、大数据计算平台为例的通用计算平台场景。
包括英文材料
学历+
算法+
TensorFlow+
PyTorch+
TensorRT+
CUDA+
Perf+
eBPF+
Linux+
内核+
Kubernetes+
Hadoop+
Spark+
HDFS+
RocksDB+
C+
相关职位

logo of kuaishou
实习J1020

1.参与AI与GPU相关项目的性能优化与研发,通过利用CPU、GPU的并行计算优化、架构优化、量化优化和异构调度等高性能优化技术,研发行业领先的高性能异构AI优化技术与编译优化技术; 2.针对搜索、推荐、广告、音视频以及大模型场景,优化模型训练和推理场景的性能; 3.与公司各算法部门深度合作,对重点项目进行算法与系统的联合优化。

更新于 2025-03-31
logo of kuaishou
实习J1014

1、负责容器云平台的一个或多个领域的设计与开发; 2、基于Kubernetes完善统一调度、多集群联邦能力,提升集群运维效率; 3、基于但不限于servicemesh技术栈,实现微服务架构业务&离线计算任务的流量管控、链路追踪等基础能力; 4、负责公司混合计算平台及相关技术的设计与开发,提升异构资源管理效率; 5、结合容器领域前沿技术,负责容器云全局技术优化与落地实践。

更新于 2025-05-20
logo of kuaishou
实习J1020

1. 负责分布式大语言模型 (LLM) 推理系统的底层基础设施研究与探索,包括 GPU 和 RDMA 等,提升 GPU 环境下的稳定性和计算效率; 2. 负责大规模模型训练场景优化工作,通过建设全面的异常发现、故障自愈机制,提升平台训练 MFU,降低训练成本; 3. 基于容器以及 Kubernetes 技术,负责对机器学习领域中的资源调度、模型训练、模型推理、数据管理等多个子方向的成本效率优化工作; 4. 持续关注并跟进业界技术发展,比如超长上下文、思维链、多模态方向;

更新于 2025-03-31
logo of kuaishou
实习J1014

1、参与快手容器云资源调度及服务编排等领域的设计与开发工作; 2、基于Kubernetes等云原生技术完善资源统一调度、服务的多集群联邦编排,提升资源及服务变更效率; 3、参与公司在离线混部系列机制的设计与开发,提升集群异构资源的使用效率; 4、探索容器领域前沿技术,参与容器云全局技术优化与落地实践。

更新于 2025-03-06