logo of kuaishou

快手【留用实习】深度学习训练平台研发工程师

实习兼职J1020地点:北京状态:招聘

任职要求


1、硕士及以上学历,专业不限,计算机相关专业优先; 
2、掌握Python/C++编程语言,了解RPC框架、集合通信和CUDA编程更佳;
3、了解AI infra 整体技术栈需求,有训练框架或推理框架实战经验、熟悉TensorflowPyTorch 的使用、有二次开发能力或开源社区贡献经历更佳;
4、具备分布式训练或HPC基础知识,有机器学习平台开发和深度学习框架开发等领域开发经验。

工作职责


1、研发业界领先的推广搜深度学习训练框架,提供面向大规模稀疏数据的解决方案,服务于快手内部所有推荐类业务场景,包括 短视频、海外、广告、电商、直播等;
2、多样的业务形态和庞大的业务规模使得框架的开发与优化极富挑战性:万量级 GPU 卡,千亿量级样本,万亿量级参数,PB 量级训练数据。
包括英文材料
学历+
Python+
C+++
RPC+
CUDA+
TensorFlow+
PyTorch+
HPC+
机器学习+
深度学习+
相关职位

logo of kuaishou
实习J1020

1、负责快手一站式机器学习平台的设计研发与迭代改进,为业务提供稳定易用、高性能、高性价比的AI中台解决方案; 2、业内机器学习系统与平台前沿技术进展跟进与调研、落地。

更新于 2025-05-19
logo of kuaishou
实习J1014

1、参与快手大规模深度学习推理引擎、大模型训练解决方案的研发与优化,包括大模型推理、模型训练框架、微调平台等; 2、参与底层算子的优化、通过优化访存pattern、计算提升推理性能,与算法部门合作,为公司大模型定制训练方案,探索RLHF、MoE、多模态、longcontext等前沿方向,提升训练性能; 3、优化推理框架上层调度策略,通过机内、机间的计算任务调度和通讯优化提升引擎性能;优化现有大语言模型相关工具和平台,提高模型训练、维护效率,降低成本,提升训练服务稳定性。

更新于 2025-05-23
logo of kuaishou
实习J1020

1.参与AI与GPU相关项目的性能优化与研发,通过利用CPU、GPU的并行计算优化、架构优化、量化优化和异构调度等高性能优化技术,研发行业领先的高性能异构AI优化技术与编译优化技术; 2.针对搜索、推荐、广告、音视频以及大模型场景,优化模型训练和推理场景的性能; 3.与公司各算法部门深度合作,对重点项目进行算法与系统的联合优化。

更新于 2025-03-31
logo of kuaishou
实习J1001

1、机器学习相关领域最新进展,包括深度学习、强化学习、迁移学习、元学习等; 2、将机器学习前沿技术在推荐、广告、游戏、风控、效率工程等业务场景进行应用落地和优化; 3、开发通用或者定制化并行的机器学习训练/推理平台; 4、集成和优化目前主流的机器学习框架,比如TensorFlow、PyTorch。

更新于 2025-03-26