logo of kuaishou

快手【快Star-X】大模型推理/训练优化工程师

校招全职J1020地点:北京 | 深圳 | 杭州状态:招聘

任职要求


1、硕士及以上学历,计算机、电子、自动化等专业优先;
2、熟悉python/C++,熟悉linux使用,有扎实的算法数据结构基础;
3、有较强的自驱力和学习力,有严谨的科研思维,沟通良好擅长与人合作;
4、了解AI infra 整体技术栈,有大模型相关训练或推理优化实战经验;有vLLM、TensorRT-LLM、MLC-LLM、Tensorflow、PyTorch等框架之一的实践经验。

加分项:
…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1、参与大模型推理/训练优化。通过研发业界领先的AI Compiler 技术,支撑搜推场景在GPU上的训练计算性能优化;支持大模型推理优化技术在异构硬件上的落地;
2、参与各种大模型推理所需的功能性开发任务;相关编译优化功能开发,以图优化、算子融合、GPU高性能算子开发及自动Codegen等技术手段不断推高在不同卡型上的计算性能极限;
3、参与支持日常的大模型推理服务部署,参与内部日常提效工具的研发。
包括英文材料
学历+
Python+
C+++
Linux+
算法+
数据结构+
大模型+
还有更多 •••
相关职位

logo of xiaohongshu
社招3年以上后端开发

【岗位职责】 1. 主导新一代训练与推理引擎的架构设计与核心模块开发,支撑搜广推业务在长序列建模、生成式推荐、Agent 等前沿场景的规模落地。 2. 与存储、数据平台深度协同,打造端到端 ML 数据 Pipeline:统一特征管理、秒级调试、版本追踪与一键上线,让数据科学家专注模型创新。 3. 持续优化训推基础设施:自研 Embedding 高速存储、特征 DSL 引擎、弹性调度与服务化推理框架,实现 10x 级性能提升。 4. 跟踪 LLM / Agent 最新进展,将其工程化落地到搜索、广告、推荐及智能体业务,定义行业新标准。

更新于 2026-04-02北京|上海
logo of mi
社招6年以上A163785

1、算法技术攻坚 深度参与 AI 客服和 x - copilot 业务的算法技术研发,聚焦于提升用户咨询交互体验。针对复杂业务场景,设计并实现高效算法,优化对话流程、意图识别及回复策略,大幅降低用户问题解决时长,提高用户满意度 2、前沿技术探索与落地 密切跟踪大模型前沿技术动态,深入研究如 GPT - 4O、DeepSeek等模型的新特性与应用方向。主动思考并分析这些技术与AI 客服和 x - copilot 业务场景的适配性,提出切实可行的落地方案 3、领域大模型的算法研发 主导垂直域大模型的训练工作,运用混合精度训练、模型压缩、知识蒸馏等技术,在保证模型性能的前提下,显著提升模型训练效率和推理速度,降低计算资源消耗

更新于 2025-06-12武汉
logo of mi
社招6年以上A127878

1、算法技术攻坚 深度参与 AI 客服和 x - copilot 业务的算法技术研发,聚焦于提升用户咨询交互体验。针对复杂业务场景,设计并实现高效算法,优化对话流程、意图识别及回复策略,大幅降低用户问题解决时长,提高用户满意度 2、前沿技术探索与落地 密切跟踪大模型前沿技术动态,深入研究如 GPT - 4O、DeepSeek等模型的新特性与应用方向。主动思考并分析这些技术与AI 客服和 x - copilot 业务场景的适配性,提出切实可行的落地方案 3、领域大模型的算法研发 主导垂直域大模型的训练工作,运用混合精度训练、模型压缩、知识蒸馏等技术,在保证模型性能的前提下,显著提升模型训练效率和推理速度,降低计算资源消耗

更新于 2025-06-12武汉
logo of kuaishou
校招J1020

1、参与多模态模型、视频生成模型等大模型的分离式推理编排、异构算力匹配、全球化计算调度; 2、参与大规模异构算力集群的算力资源池化、弹性资源混部、潮汐资源调度; 3、基于HBO、强化学习等优化算法,持续优化工业级多模态视频生成、多模态内容理解系统的耗时体验与算力消耗。

更新于 2025-06-27北京