logo of kuaishou

快手【快Star-X实习】训推框架编译优化工程师

实习兼职J1020地点:北京状态:招聘

任职要求


1、硕士及以上学历,专业不限,计算机相关专业优先; 
2、了解AI infra 整体技术栈需求,有训练框架或推理框架实战经验、熟悉TensorflowPyTorch 的使用、有二次开发能力或开源社区贡献经历更佳;

加分项:
1、有大模型相关训练或推理优化经验或GPU 高性能算子开发经验;有vLLMTensorRT-LLM、MLC-LLM 等框架之一的实践经验;
2、熟悉深度学习编译优化或异构硬件,有 XLA/ TVM /MLIR 开发、优化经验,熟悉pass编写或代码生成原理和实践;或有传统编译器开发经验,熟悉LLVM原理和使用;?4、实习时长3个月及以上, 优先长期实习。

工作职责


1、参与研发业界领先的深度学习编译技术,落地计算优化、显存优化及分布式优化技术到训练框架和推理框架中,赋能深度学习算法落地;
2、XLA 相关编译优化功能开发;
3、结合pytorch/tensorflow等上下游框架适配与集成;
4、异构大模型推理引擎优化,负责调研NV 上各种推理引擎的优化技术,并支持大模型推理各种优化技术在异构硬件上的落地。
包括英文材料
学历+
TensorFlow+
PyTorch+
大模型+
vLLM+
TensorRT+
深度学习+
LLVM+
相关职位

logo of freshippo
实习盒马2026届实

1、参与盒马智能设计产品的AI方向研发工作,从设计 X 技术的视角出发,根据实际场景的不同画面要求,搭建工作流,训模型,配置参数,并上架产品 2、了解行业动态及相关产品,乐于钻研AIGC技术,熟练使用AIGC工具,能够在工作中和产品技术共同攻克难题,协同产品和技术将创意流程产品化落地 3、具备扎实的创意设计功底,兼具审美、表现力和AI技术实现能力,能够独立完成高品质创意设计产出

更新于 2025-03-18
logo of kuaishou
实习J1001

1、依托快手海量内容生产、消费、流量数据,基于短视频、直播等业务生态,挖掘用户画像属性,构建公司级用户画像数据体系和平台产品,深度参与创作者、直播、运营、增长等业务策略方案制定及实施,直接为业务提效赋能并达成新的增长点; 2、基于业务策略服务方案,面向全站用户、内容、社区沉淀数据标签资产至数据中台,为业务运营决策提供基础标签能力支撑,并不断挖掘、萃取数据价值; 3、基于海量、异构、高维的时空大数据,建设精准的全域空间实体数据体系,搭建全方位的地理位置服务(LBS); 4、建设业内一流的设备指纹引擎,整合快手海量多来源数据,建设全站统一的ID-Mapping服务框架。

更新于 2025-06-23
logo of kuaishou
实习J1020

1、参与大模型推理/训练优化。通过研发业界领先的AI Compiler 技术,支撑搜推场景在GPU上的训练计算性能优化;支持大模型推理优化技术在异构硬件上的落地; 2、参与各种大模型推理所需的功能性开发任务;相关编译优化功能开发,以图优化、算子融合、GPU高性能算子开发及自动Codegen等技术手段不断推高在不同卡型上的计算性能极限; 3、参与支持日常的大模型推理服务部署,参与内部日常提效工具的研发。

更新于 2025-06-04
logo of kuaishou
实习J1020

1、参与快手大规模深度学习推理引擎、大模型训练解决方案的研发与优化,包括大模型推理、模型训练框架、微调平台等; 2、参与底层算子的优化、通过优化访存pattern、计算提升推理性能。与算法部门合作,为公司大模型定制训练方案,探索RLHF、MoE、多模态、longcontext等前沿方向,提升训练性能; 3、优化推理框架上层调度策略,通过机内、机间的计算任务调度和通讯优化提升引擎性能;优化现有大语言模型相关工具和平台,提高模型训练、维护效率,降低成本,提升训练服务稳定性。

更新于 2025-06-04