logo of kuaishou

快手【快Star-X】基础大模型训练推理引擎研发工程师

校招全职J1001地点:北京状态:招聘

任职要求


1、精通Pytho/C++编程,有较好的编程风格和代码管理能力;
2、有优秀的逻辑分析能力,有较好的数学基础;
3、有开源大模型训练推理框架(pytorch/megatron/vllm/sglang)使用经验者优先;
4、有相关实习经验优先。

工作职责


1、参与快手大语言模型、多模态基座模型的训练/推理引擎研发及优化工作;
2、参与快手自研生成式推荐大模型训练全链路开发和优化,以及快手广告、电商、直播、搜索等全域模型的训练全链路研发与优化;
3、设计和优化分布式训练框架,通过混合并行,通信计算overlap、低精度训练等方法解决超长序列、超大规模moe场景下的训练效率问题;
4、参与通用高性能RL框架的开发和优化,包括但不限于高效rollout、高效RL链路调度优化等;
5、通过各种技术手段持续优化性能,降低推理成本,包括但不限于:算子/编译优化、异构推理、模型量化&蒸馏、分布式并行等。
包括英文材料
大模型+
算法+
PyTorch+
TensorFlow+
C+++
Megatron+
vLLM+
SGLang+
相关职位

logo of kuaishou
校招J1020

1、参与快手大规模深度学习推理引擎、大模型训练解决方案的研发与优化,包括大模型推理、模型训练框架、微调平台等; 2、参与底层算子的优化、通过优化访存pattern、计算提升推理性能。与算法部门合作,为公司大模型定制训练方案,探索RLHF、MoE、多模态、longcontext等前沿方向,提升训练性能; 3、优化推理框架上层调度策略,通过机内、机间的计算任务调度和通讯优化提升引擎性能;优化现有大语言模型相关工具和平台,提高模型训练、维护效率,降低成本,提升训练服务稳定性。

更新于 2025-06-24
logo of kuaishou
实习J1020

1、参与快手大规模深度学习推理引擎、大模型训练解决方案的研发与优化,包括大模型推理、模型训练框架、微调平台等; 2、参与底层算子的优化、通过优化访存pattern、计算提升推理性能。与算法部门合作,为公司大模型定制训练方案,探索RLHF、MoE、多模态、longcontext等前沿方向,提升训练性能; 3、优化推理框架上层调度策略,通过机内、机间的计算任务调度和通讯优化提升引擎性能;优化现有大语言模型相关工具和平台,提高模型训练、维护效率,降低成本,提升训练服务稳定性。

更新于 2025-06-04
logo of kuaishou
校招J1020

1、参与快手模型训练推理的深度研发,提升模型训练、推理的框架性能; 2、与算法部门合作,为快手大模型定制训练方案,探索大模型的 RLHF、MoE、多模态、longcontext等前沿方向,提升训练性能; 3、分析服务器、手机端模型的推理特点,对计算、访存和通讯做出针对性优化; 4、关注前沿技术,跟进业内最新研究进展和应用趋势,提出创新思路和方向。

更新于 2025-07-09
logo of kuaishou
实习J1020

1、参与快手模型训练推理的深度研发,提升模型训练、推理的框架性能; 2、与算法部门合作,为快手大模型定制训练方案,探索大模型的 RLHF、MoE、多模态、longcontext等前沿方向,提升训练性能; 3、分析服务器、手机端模型的推理特点,对计算、访存和通讯做出针对性优化; 4、关注前沿技术,跟进业内最新研究进展和应用趋势,提出创新思路和方向。

更新于 2025-05-06