快手【快Star-X】多模态推理引擎工程师

校招全职J10012025-07-18地点：上海 | 北京状态：招聘

扫码手机上打开

任职要求

1、有较强的学习能力和编程能力及数学基础
2、有开源大模型推理框架(vllm/slang/trt-llm)使用和优化经验者…

登录查看完整任职要求

微信扫码，1秒登录

工作职责

参与快手大模型推理引擎研发，工作内容包括：
1、参与大模型推理引擎的设计和研发，支撑快手自研以及开源模型的快速部署和高性能推理
2、通过各种技术手段持续优化性能，降低推理成本，包括但不限于：算子/编译优化、异构推理、模型量化&蒸馏、分布式并行等
3、支持RL中的多样化采样、generation性能优化等

📮 投递简历 ✨AI模拟面试

难度：

包括英文材料

大模型+

还有更多 •••

登录查看完整学习资料

相关职位

【快Star-X】多模态算力引擎研发工程师

校招J1020

1、参与多模态模型、视频生成模型等大模型的分离式推理编排、异构算力匹配、全球化计算调度； 2、参与大规模异构算力集群的算力资源池化、弹性资源混部、潮汐资源调度； 3、基于HBO、强化学习等优化算法，持续优化工业级多模态视频生成、多模态内容理解系统的耗时体验与算力消耗。

更新于 2025-06-27北京

【快Star-X】多模态数据生产引擎研发工程师

校招J1020

1、参与多模态模型、视频生成模型等大模型的全链路数据生产流水线搭建； 2、参与多模态数据处理所需的LLM/VLM模型推理、跨模态检索、跨模态对齐等工程系统的建设； 3、基于各类分布式数据处理以及推理优化技术，持续优化超大规模多模态数据处理的推理、存储以及检索效率。

更新于 2025-06-27北京

【快Star-X】多模态训推引擎研发工程师

校招J1020

1、基础设施与模型融合研究：紧密关注新一代基础设施的迭代，如高性能的新一代网卡、超节点服务器以及先进的集群拓扑结构等，结合多模态任务下多模型（涵盖 visual tokenizer、diffusion、LLM 等）长 pipeline 特点，探索更先进、高效的多模态模型架构以及训推解决方案； 2、分布式系统优化：运用分布式系统迭代、系统算法 codesign 等手段，针对模型规模、集群规模、context length 持续 scaling up 过程中出现的诸多挑战展开深入研究。具体包括但不限于解决训练过程中的 MFU 与稳定性问题，优化推理环节的时延与吞吐，以及应对超长序列带来的训推显存压力等难题； 3、卓越系统打造：通过持续的创新与优化实践，致力于打造业界卓越的分布式训推系统，推动相关技术在实际应用场景中的高效落地，提升整体系统性能与竞争力，为 kling 等核心模型发展提供坚实支撑。

更新于 2025-06-26上海|北京

【快Star-X】基础大模型训练推理引擎研发工程师

校招J1001

1、参与快手大语言模型、多模态基座模型的训练/推理引擎研发及优化工作； 2、参与快手自研生成式推荐大模型训练全链路开发和优化，以及快手广告、电商、直播、搜索等全域模型的训练全链路研发与优化； 3、设计和优化分布式训练框架，通过混合并行，通信计算overlap、低精度训练等方法解决超长序列、超大规模moe场景下的训练效率问题； 4、参与通用高性能RL框架的开发和优化，包括但不限于高效rollout、高效RL链路调度优化等； 5、通过各种技术手段持续优化性能，降低推理成本，包括但不限于：算子/编译优化、异构推理、模型量化&蒸馏、分布式并行等。

更新于 2025-07-25北京