快手【留用实习】异构计算平台优化工程师

实习兼职J10202026-01-14地点：上海 | 北京状态：招聘

扫码手机上打开

任职要求

1、本科及以上学历，深入理解处理器体系结构(X86/ARM)或者常见GPGPU/NPU系统架构，了解CPU/GPU微架构、PMU等相关子领域；
2、对AI领域的基本理论与常见模型算法有深刻理解，熟练使用tensorflow或pytorch进行模型训练或tensorrt/tvm做推理优化，对使用GPU做AI算法加速有相关经历，熟悉GPU CUDA编程；
3、深入理解操作系统架构和实现原理，熟练掌握问题定位手段(perf、SystemTap、eBPF)，精通软硬件系统性能分析及优化；
4、熟悉Linux kernel、虚拟化系统(KVM/QEMU/…

登录查看完整任职要求

微信扫码，1秒登录

工作职责

1、负责依据不同业务场景的特点和新硬件特性，结合系统软硬件栈的整体调优，提出并实施性能优化方案；
2、负责持续跟踪业内软硬件相关领域的技术发展趋势，结合不同业务场景未来需求，开展方案预研以及推广应用工作。

具体包括以下两种场景或者两种之一：
1）AI计算相关场景，例如：大模型训练场景，AIGC、NLP、推荐等常规推理场景；
2）以容器云、大数据计算平台为例的通用计算平台场景。

📮 投递简历 ✨AI模拟面试

难度：

包括英文材料

学历+

算法+

TensorFlow+

PyTorch+

TensorRT+

CUDA+

Perf+

eBPF+

还有更多 •••

登录查看完整学习资料

相关职位

【留用实习】AI性能优化工程师

实习J1020

1.参与AI与GPU相关项目的性能优化与研发，通过利用CPU、GPU的并行计算优化、架构优化、量化优化和异构调度等高性能优化技术，研发行业领先的高性能异构AI优化技术与编译优化技术； 2.针对搜索、推荐、广告、音视频以及大模型场景，优化模型训练和推理场景的性能； 3.与公司各算法部门深度合作，对重点项目进行算法与系统的联合优化。

更新于 2025-03-31杭州|北京

【留用实习】容器云研发工程师

实习J1014

1、负责容器云平台的一个或多个领域的设计与开发； 2、基于Kubernetes完善统一调度、多集群联邦能力，提升集群运维效率； 3、基于但不限于servicemesh技术栈，实现微服务架构业务&离线计算任务的流量管控、链路追踪等基础能力； 4、负责公司混合计算平台及相关技术的设计与开发，提升异构资源管理效率； 5、结合容器领域前沿技术，负责容器云全局技术优化与落地实践。

更新于 2025-05-20杭州|北京

【留用实习】AI Infra研发工程师

实习J1020

1. 负责分布式大语言模型 (LLM) 推理系统的底层基础设施研究与探索，包括 GPU 和 RDMA 等，提升 GPU 环境下的稳定性和计算效率； 2. 负责大规模模型训练场景优化工作，通过建设全面的异常发现、故障自愈机制，提升平台训练 MFU，降低训练成本； 3. 基于容器以及 Kubernetes 技术，负责对机器学习领域中的资源调度、模型训练、模型推理、数据管理等多个子方向的成本效率优化工作； 4. 持续关注并跟进业界技术发展，比如超长上下文、思维链、多模态方向；

更新于 2025-03-31杭州

【留用实习】容器云编排调度研发工程师

实习J1014

1、参与快手容器云资源调度及服务编排等领域的设计与开发工作； 2、基于Kubernetes等云原生技术完善资源统一调度、服务的多集群联邦编排，提升资源及服务变更效率； 3、参与公司在离线混部系列机制的设计与开发，提升集群异构资源的使用效率； 4、探索容器领域前沿技术，参与容器云全局技术优化与落地实践。

更新于 2025-03-06北京