快手【快Star-X实习】引擎研发工程师

实习兼职J10202025-05-06地点：北京状态：招聘

扫码手机上打开

任职要求

1、硕士及以上学历，专业不限，计算机相关专业优先； 
2、掌握Python/C++编程语言，熟练使用Pytorch 框架或者有 vllm/tensorrt 等推理框架使用经验；
3、具备分布式训练或HPC基础知识，了解集合通信和CUDA…

登录查看完整任职要求

微信扫码，1秒登录

工作职责

1、参与快手模型训练推理的深度研发，提升模型训练、推理的框架性能；
2、与算法部门合作，为快手大模型定制训练方案，探索大模型的 RLHF、MoE、多模态、longcontext等前沿方向，提升训练性能；
3、分析服务器、手机端模型的推理特点，对计算、访存和通讯做出针对性优化；
4、关注前沿技术，跟进业内最新研究进展和应用趋势，提出创新思路和方向。

📮 投递简历 ✨AI模拟面试

难度：

包括英文材料

学历+

Python+

C+++

PyTorch+

vLLM+

TensorRT+

还有更多 •••

登录查看完整学习资料

相关职位

【快Star-X实习】大模型推理/训练引擎研发工程师

实习J1020

1、参与快手大规模深度学习推理引擎、大模型训练解决方案的研发与优化，包括大模型推理、模型训练框架、微调平台等； 2、参与底层算子的优化、通过优化访存pattern、计算提升推理性能。与算法部门合作，为公司大模型定制训练方案，探索RLHF、MoE、多模态、longcontext等前沿方向，提升训练性能； 3、优化推理框架上层调度策略，通过机内、机间的计算任务调度和通讯优化提升引擎性能；优化现有大语言模型相关工具和平台，提高模型训练、维护效率，降低成本，提升训练服务稳定性。

更新于 2025-06-04北京

【快Star-X】基础大模型训练推理引擎研发工程师

校招J1001

1、参与快手大语言模型、多模态基座模型的训练/推理引擎研发及优化工作； 2、参与快手自研生成式推荐大模型训练全链路开发和优化，以及快手广告、电商、直播、搜索等全域模型的训练全链路研发与优化； 3、设计和优化分布式训练框架，通过混合并行，通信计算overlap、低精度训练等方法解决超长序列、超大规模moe场景下的训练效率问题； 4、参与通用高性能RL框架的开发和优化，包括但不限于高效rollout、高效RL链路调度优化等； 5、通过各种技术手段持续优化性能，降低推理成本，包括但不限于：算子/编译优化、异构推理、模型量化&蒸馏、分布式并行等。

更新于 2025-07-25北京

【快Star-X】多模态推理引擎工程师

校招J1001

参与快手大模型推理引擎研发，工作内容包括： 1、参与大模型推理引擎的设计和研发，支撑快手自研以及开源模型的快速部署和高性能推理 2、通过各种技术手段持续优化性能，降低推理成本，包括但不限于：算子/编译优化、异构推理、模型量化&蒸馏、分布式并行等 3、支持RL中的多样化采样、generation性能优化等

更新于 2025-07-18上海|北京

【快Star-X实习】训推框架编译优化工程师

实习J1020

1、参与研发业界领先的深度学习编译技术，落地计算优化、显存优化及分布式优化技术到训练框架和推理框架中，赋能深度学习算法落地； 2、XLA 相关编译优化功能开发； 3、结合pytorch/tensorflow等上下游框架适配与集成； 4、异构大模型推理引擎优化，负责调研NV 上各种推理引擎的优化技术，并支持大模型推理各种优化技术在异构硬件上的落地。

更新于 2025-05-14北京