快手【快Star-X】大模型推理/训练引擎研发工程师

校招全职J10202025-06-24地点：上海 | 北京状态：招聘

扫码手机上打开

任职要求

1、本科以上学历，电子、自动化、计算机类专业优先；
2、了解分布式系统或高性能计算相关知识，具备良好的系统编程、数据结构、算法基础、系统设计能力；
3、熟悉Linux开发环境、熟练使用Pytorch训练框架，掌握 C++/Python编程语言；
4、具有良好的团队合作精神和沟通能力。热爱钻研技术，善于分析、解决工程问题，能够对算法和底层的协同优化起到核心桥梁作用。

加分项：
1、熟悉t…

登录查看完整任职要求

微信扫码，1秒登录

工作职责

1、参与快手大规模深度学习推理引擎、大模型训练解决方案的研发与优化，包括大模型推理、模型训练框架、微调平台等；
2、参与底层算子的优化、通过优化访存pattern、计算提升推理性能。与算法部门合作，为公司大模型定制训练方案，探索RLHF、MoE、多模态、longcontext等前沿方向，提升训练性能；
3、优化推理框架上层调度策略，通过机内、机间的计算任务调度和通讯优化提升引擎性能；优化现有大语言模型相关工具和平台，提高模型训练、维护效率，降低成本，提升训练服务稳定性。

📮 投递简历 ✨AI模拟面试

难度：

包括英文材料

学历+

分布式系统+

数据结构+

算法+

系统设计+

Linux+

PyTorch+

C+++

还有更多 •••

登录查看完整学习资料

相关职位

深度学习推理优化工程师-引擎架构

社招3年以上后端开发

【岗位职责】 1. 主导新一代训练与推理引擎的架构设计与核心模块开发，支撑搜广推业务在长序列建模、生成式推荐、Agent 等前沿场景的规模落地。 2. 与存储、数据平台深度协同，打造端到端 ML 数据 Pipeline：统一特征管理、秒级调试、版本追踪与一键上线，让数据科学家专注模型创新。 3. 持续优化训推基础设施：自研 Embedding 高速存储、特征 DSL 引擎、弹性调度与服务化推理框架，实现 10x 级性能提升。 4. 跟踪 LLM / Agent 最新进展，将其工程化落地到搜索、广告、推荐及智能体业务，定义行业新标准。

更新于 2026-04-02北京|上海

【快Star-X】多模态算力引擎研发工程师

校招J1020

1、参与多模态模型、视频生成模型等大模型的分离式推理编排、异构算力匹配、全球化计算调度； 2、参与大规模异构算力集群的算力资源池化、弹性资源混部、潮汐资源调度； 3、基于HBO、强化学习等优化算法，持续优化工业级多模态视频生成、多模态内容理解系统的耗时体验与算力消耗。

更新于 2025-06-27北京

【快Star-X】多模态数据生产引擎研发工程师

校招J1020

1、参与多模态模型、视频生成模型等大模型的全链路数据生产流水线搭建； 2、参与多模态数据处理所需的LLM/VLM模型推理、跨模态检索、跨模态对齐等工程系统的建设； 3、基于各类分布式数据处理以及推理优化技术，持续优化超大规模多模态数据处理的推理、存储以及检索效率。

更新于 2025-06-27北京

【快Star-X】基础大模型训练推理引擎研发工程师

校招J1001

1、参与快手大语言模型、多模态基座模型的训练/推理引擎研发及优化工作； 2、参与快手自研生成式推荐大模型训练全链路开发和优化，以及快手广告、电商、直播、搜索等全域模型的训练全链路研发与优化； 3、设计和优化分布式训练框架，通过混合并行，通信计算overlap、低精度训练等方法解决超长序列、超大规模moe场景下的训练效率问题； 4、参与通用高性能RL框架的开发和优化，包括但不限于高效rollout、高效RL链路调度优化等； 5、通过各种技术手段持续优化性能，降低推理成本，包括但不限于：算子/编译优化、异构推理、模型量化&蒸馏、分布式并行等。

更新于 2025-07-25北京