快手大模型推理/训练优化工程师

校招全职J10202025-08-11地点：杭州 | 深圳 | 北京状态：招聘

扫码手机上打开

任职要求

1、硕士及以上学历，计算机、电子、自动化等专业优先；
2、熟悉python/C++，熟悉linux使用，有扎实的算法与数据结构基础；
3、有较强的自驱力和学习力，有严谨的科研思维，沟通良好擅长与人合作；
4、了解AI infra 整体技术栈，有大模型相关训练或推理优化实战经验；有vLLM、TensorRT-LLM、MLC-LLM、Tensorflow、PyTorch等框架之一的实践经验。

加分项：
…

登录查看完整任职要求

微信扫码，1秒登录

工作职责

1、参与大模型推理/训练优化。通过研发业界领先的AI Compiler 技术，支撑搜推场景在GPU上的训练计算性能优化；支持大模型推理优化技术在异构硬件上的落地；
2、参与各种大模型推理所需的功能性开发任务；相关编译优化功能开发，以图优化、算子融合、GPU高性能算子开发及自动Codegen等技术手段不断推高在不同卡型上的计算性能极限；
3、参与支持日常的大模型推理服务部署，参与内部日常提效工具的研发。

📮 投递简历 ✨AI模拟面试

难度：

包括英文材料

学历+

Python+

C+++

Linux+

算法+

数据结构+

大模型+

还有更多 •••

登录查看完整学习资料

相关职位

AIGC模型推理/训练优化工程师-豆包大模型

社招1年以上A221377

团队介绍：字节跳动豆包大模型团队成立于 2023 年，致力于开发业界最先进的 AI 大模型技术，成为世界一流的研究团队，为科技和社会发展作出贡献。豆包大模型团队在AI领域拥有长期愿景与决心，研究方向涵盖NLP、CV、语音等，在中国、新加坡、美国等地设有实验室和研究岗位。团队依托平台充足的数据、计算等资源，在相关领域持续投入，已推出自研通用大模型，提供多模态能力，下游支持豆包、扣子、即梦等50+业务，并通过火山引擎开放给企业客户。目前，豆包APP已成为中国市场用户量最大的AIGC应用。 1、负责开发和优化公司级的AIGC推理框架，通过编译优化、并行计算优化、图融合、高效 CUDA 算子开发、低精度计算、高并发服务请求优化等高性能优化技术打造业界领先的 AIGC 推理引擎； 2、负责 AIGC训练优化算法研究和落地，通过数据并行、模型并行、Pipeline并行、通信优化等基于 CUDA 的分布式训练框架大幅提升模型的训练速度与效率； 3、与公司各算法部门深度合作，分析业务性能瓶颈，通过软硬结合的方式，高效部署与优化AIGC核心业务模型，落地到字节各产品线，投入AI工具链开发及技术生态的建设，支撑字节AI方向重要业务的发展；

更新于 2024-05-20北京

【留用实习】大模型推理/训练优化工程师

社招J1020

1、参与大模型推理/训练优化。通过研发业界领先的AI Compiler 技术，支撑搜推场景在GPU上的训练计算性能优化；支持大模型推理优化技术在异构硬件上的落地； 2、参与各种大模型推理所需的功能性开发任务；相关编译优化功能开发，以图优化、算子融合、GPU高性能算子开发及自动Codegen等技术手段不断推高在不同卡型上的计算性能极限； 3、参与支持日常的大模型推理服务部署，参与内部日常提效工具的研发。

更新于 2025-05-26北京

【快Star-X】大模型推理/训练优化工程师

校招J1020

更新于 2025-07-22北京|深圳|杭州

【快Star-X实习】大模型推理/训练优化工程师

实习J1020

更新于 2025-06-04北京|杭州