logo of kuaishou

快手【留用实习】AI Infra研发工程师

实习兼职J1020地点:杭州状态:招聘

任职要求


1. 本科及以上学历,计算机相关专业;
2. 掌握常用数据结构算法,具备扎实的编程基础和良好的编码习惯;
3. 熟悉至少一种编程语言(如 GolangJavaPython 等); 
4. 有 Docker、Kubernetes、vLLM、SGLang、RouteLLM 等技术的学习或实践经验者优先,参与过开源项目更佳;  
5. 积极主动,自驱力强,具备良好的…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1. 负责分布式大语言模型 (LLM) 推理系统的底层基础设施研究与探索,包括 GPU 和 RDMA 等,提升 GPU 环境下的稳定性和计算效率;
2. 负责大规模模型训练场景优化工作,通过建设全面的异常发现、故障自愈机制,提升平台训练 MFU,降低训练成本;
3. 基于容器以及 Kubernetes 技术,负责对机器学习领域中的资源调度、模型训练、模型推理、数据管理等多个子方向的成本效率优化工作;
4. 持续关注并跟进业界技术发展,比如超长上下文、思维链、多模态方向;
包括英文材料
学历+
数据结构+
算法+
编程规范+
Go+
Java+
Python+
还有更多 •••
相关职位

logo of kuaishou
社招J1020

1、参与大模型推理/训练优化。通过研发业界领先的AI Compiler 技术,支撑搜推场景在GPU上的训练计算性能优化;支持大模型推理优化技术在异构硬件上的落地; 2、参与各种大模型推理所需的功能性开发任务;相关编译优化功能开发,以图优化、算子融合、GPU高性能算子开发及自动Codegen等技术手段不断推高在不同卡型上的计算性能极限; 3、参与支持日常的大模型推理服务部署,参与内部日常提效工具的研发。

更新于 2025-05-26北京
logo of kuaishou
实习J1020

1、研发业界领先的推广搜深度学习训练框架,提供面向大规模稀疏数据的解决方案,服务于快手内部所有推荐类业务场景,包括 短视频、海外、广告、电商、直播等; 2、多样的业务形态和庞大的业务规模使得框架的开发与优化极富挑战性:万量级 GPU 卡,千亿量级样本,万亿量级参数,PB 量级训练数据。

更新于 2025-05-16北京
logo of kuaishou
实习J1020

1、参与研发业界领先的深度学习编译技术,落地计算优化、显存优化及分布式优化技术到训练框架和推理框架中,赋能深度学习算法落地; 2、XLA 相关编译优化功能开发; 3、结合pytorch/tensorflow等上下游框架适配与集成; 4、异构大模型推理引擎优化,负责调研NV 上各种推理引擎的优化技术,并支持大模型推理各种优化技术在异构硬件上的落地。

更新于 2025-05-14北京
logo of meitu
校招研发类

岗位概述 参与美图影像研究院(MT Lab)核心 AI 底层基础设施与前沿交互应用的研发。作为支撑算法落地的全栈工程核心,你将参与构建从底层算子优化、算法中台到上层 AR 渲染的全链路系统,将前沿的计算机视觉与 AIGC 理论转化为影响亿级用户的真实影像体验。 本岗位为 2026 年暑期实习,全职实习时长 5 个月以上。实习期间表现优秀者,将有机会获得留用。 职责方向 ● 算法平台研发: 参与 AI 算法中台及基础设施的架构设计与 C++ 开发,构建支撑海量数据与大模型的高效训练、自动化评测与部署工具链。 ● 前沿 AR 研发: 参与跨平台 AR 特效引擎及图形渲染的底层研发,配合设计师打造创新 AR 特效,并对渲染相关技术进行前瞻性研究。 ● 极限算法调优: 深入 AI 落地“最后一公里”,负责深度学习模型在异构硬件(移动端/PC/服务端)上的极限性能调优,涵盖算子优化、内存管理及并发加速。 ● 全栈工程协作: 与顶尖算法研究员深度协作,以全栈视角理解复杂 AI 逻辑,设计高可用、高扩展的工程架构,加速 AI 能力的业务化落地。 任职资格 ● 教育背景: 本科及以上学历在读,计算机、人工智能、数学、电子等相关专业。 ● 计算机基础: 具备极度扎实的计算机科学基础,深入理解数据结构与算法、操作系统体系结构及计算机原理。 ● C++ 编程能力: 熟练掌握 C/C++,具备优秀的系统级开发、性能 Profiling 与复杂问题 Debug 能力,代码风格优雅。 ● AI Native 心态: 习惯并热衷于利用大模型等 AI 工具辅助开发。 ● 算法好奇心: 能够从底层架构视角洞察 AI 模型的工作原理,有志于成长为“懂算法”的全栈工程师。 ● 沟通与内驱力: 具备良好的沟通能力,能清晰阐述技术权衡;有独立解决前沿工程难题的内驱力。 加分项 ● 底层优化经验: 熟悉 ARM NEON 汇编、CUDA/OpenCL 编程,或有 TensorRT、NCNN 等推理框架实战经验。 ● 图形学背景: 熟悉计算机图形学,有 OpenGL、Vulkan 或 Metal 等底层图形 API 开发经验。 ● 开源与竞赛: 在 GitHub 相关生态中有实际 PR 贡献,或在 ACM/ICPC、NOI 等高水平算法竞赛中获得过优异成绩。 Overview: Join the MT Lab to build core AI infrastructure and pioneering interactive applications. As a full-stack engineering core supporting algorithm deployment, you will work on an end-to-end system spanning low-level operator optimization, algorithm middleware, and high-level AR rendering. Your mission is to transform cutting-edge Computer Vision and AIGC theories into ultimate imaging experiences for hundreds of millions of users. This is a full-time summer 2026 internship (5+ months). Strong performers will be considered for a return offer. Responsibilities ● Algorithm Platform R&D: Contribute to the architectural design and C++ development of AI middleware and infrastructures. You will build toolchains that support high-efficiency training, automated evaluation, and deployment for massive data and large-scale models. ● Frontier AR Development: Engage in the low-level C++ development of cross-platform AR engines and graphics rendering. Work closely with designers to create innovative AR effects and conduct forward-looking research on rendering technologies. ● Extreme Algorithm Tuning: Solve the "last mile" of AI deployment by conducting extreme performance optimization on heterogeneous hardware (Mobile/PC/Server), covering operator optimization, memory management, and multi-threading. ● Full-Stack Engineering Collaboration: Work closely with top-tier research scientists. You will interpret complex AI logic from a full-stack perspective to design high-availability and scalable architectures, accelerating the commercialization of AI capabilities.

更新于 2026-05-20深圳