logo of kuaishou

快手大模型推理优化实习生-【游戏事业部】

实习兼职D8039地点:杭州状态:招聘

任职要求


1、硕士及以上学历,计算机/电子/自动化/人工智能等相关专业;
2、扎实的代码能力、数据结构和基础算法功底,熟练掌握 PythonC/C++;
3、熟悉常见的LLM推理优化方案,包括但不限于 Continuous Batching、FlashAttention、MLA,量化,剪枝、PD 分离、投机采样等;
4、熟悉 GPU 体系结构及相关高性能计算加速技术,了解常用的 CUDA 优化方法;
5、熟悉业内主流的大模型推理框架,如vLLM、SGLang、LMDeployTensorRT-LLM等;
6、熟悉业内主流端侧推理框架,如MNN、OpenVINO,TensorRT,SNPE 等;
7、有LinuxWindowsAndroid,IOS等跨平台开发能力者优先;
8、有ASR、TTS、边缘AI部署经验者优先;
9、有强烈的工作责任心,良好的学习能力、沟通能力和自驱力。

工作职责


1、协助大模型(LLM、扩散等)在云端的服务部署和推理加速优化;
2、参与AI模型端侧部署能力建设:利用 TensorRT、ONNX Runtime、MNN、OPENVINO 等端侧推理框架构建跨系统(如Linux,Windows,Android,IOS)、跨硬件平台(如 CPU、GPU、NPU )的模型端侧部署和推理加速能力,同时保障模型部署在多场景下的稳定性与兼容性;
3、完成团队其它AI工程化相关的工作;
4、跟踪业内最新的研究进展和技术趋势,提出改进和创新的想法,推动团队技术发展。
包括英文材料
学历+
数据结构+
算法+
Python+
C+
C+++
大模型+
CUDA+
vLLM+
LMDeploy+
TensorRT+
MNN+
Linux+
Windows+
Android+
相关职位

logo of cainiao
实习菜鸟集团2026

1、负责动态图优化、算子优化,Auto-Tuning、量化训练、模型推理部署、大模型训练等,提升训练的性能,降低算法的在线时延; 2、研发自动驾驶的高性能推理系统框架,支持GPU/CPU的异构推理; 3、追踪自动驾驶行业和深度学习技术的最新进展,力争打造菜鸟无人驾驶系统,开创未来无人物流的新格局。

更新于 2025-04-01
logo of bytedance
实习A171437

日常实习:面向全体在校生,为符合岗位要求的同学提供为期3个月及以上的项目实践机会。 团队介绍:字节跳动 Seed 团队成立于 2023 年,致力于寻找通用智能的新方法,追求智能上限。团队研究方向涵盖 LLM、语音、视觉、世界模型、基础架构、AI Infra、下一代 AI 交互等,在中国、新加坡、美国等地设有实验室和岗位。 Seed 团队在 AI 领域拥有长期愿景与决心,坚持深耕基础,期望成为世界一流的 AI 研究团队,为科技和社会发展作出贡献。目前团队已推出业界领先的通用大模型以及前沿的多模态能力,支持豆包、扣子、即梦等超过 50 个应用场景。 1、探索应用多模态理解、生成式、机器学习、强化学习、AIGC、计算机视觉、人工智能等前沿技术; 2、探索大规模/超大规模多模态理解与生成交织的基础模型,并进行极致系统优化;数据建设、指令微调、偏好对齐、模型优化;提升数据合成、Scalable Oversight、模型推理、规划能力,构建全面客观准确的评测体系,探索提升大模型能力; 3、探索突破包括而不限于多模态RAG,视觉COT与Agent等在内的多模态模型、世界模型进阶能力,构建GUI/游戏等虚拟世界的通用多模态Agent、应用; 4、利用预训练、仿真等技术对虚拟/现实世界的各类环境进行建模,提供多模态交互探索的基本能力,推动应用落地,研发以人工智能技术为核心的新技术、新产品。

更新于 2023-03-29
logo of bytedance
实习O7390

日常实习:面向全体在校生,为符合岗位要求的同学提供为期3个月及以上的项目实践机会。 团队介绍:字节跳动 Seed 团队成立于 2023 年,致力于寻找通用智能的新方法,追求智能上限。团队研究方向涵盖 LLM、语音、视觉、世界模型、基础架构、AI Infra、下一代 AI 交互等,在中国、新加坡、美国等地设有实验室和岗位。 Seed 团队在 AI 领域拥有长期愿景与决心,坚持深耕基础,期望成为世界一流的 AI 研究团队,为科技和社会发展作出贡献。目前团队已推出业界领先的通用大模型以及前沿的多模态能力,支持豆包、扣子、即梦等超过 50 个应用场景。 1、探索应用多模态理解、生成式、机器学习、强化学习、AIGC、计算机视觉、人工智能等前沿技术; 2、探索大规模/超大规模多模态理解与生成交织的基础模型,并进行极致系统优化;数据建设、指令微调、偏好对齐、模型优化;提升数据合成、Scalable Oversight、模型推理、规划能力,构建全面客观准确的评测体系,探索提升大模型能力; 3、探索突破包括而不限于多模态RAG,视觉COT与Agent等在内的多模态模型、世界模型进阶能力,构建GUI/游戏等虚拟世界的通用多模态Agent、应用; 4、利用预训练、仿真等技术对虚拟/现实世界的各类环境进行建模,提供多模态交互探索的基本能力,推动应用落地,研发以人工智能技术为核心的新技术、新产品。

更新于 2023-03-28
logo of bytedance
实习A76356

日常实习:面向全体在校生,为符合岗位要求的同学提供为期3个月及以上的项目实践机会。 团队介绍:字节跳动 Seed 团队成立于 2023 年,致力于寻找通用智能的新方法,追求智能上限。团队研究方向涵盖 LLM、语音、视觉、世界模型、基础架构、AI Infra、下一代 AI 交互等,在中国、新加坡、美国等地设有实验室和岗位。 Seed 团队在 AI 领域拥有长期愿景与决心,坚持深耕基础,期望成为世界一流的 AI 研究团队,为科技和社会发展作出贡献。目前团队已推出业界领先的通用大模型以及前沿的多模态能力,支持豆包、扣子、即梦等超过 50 个应用场景。 1、探索应用多模态理解、生成式、机器学习、强化学习、AIGC、计算机视觉、人工智能等前沿技术; 2、探索大规模/超大规模多模态理解与生成交织的基础模型,并进行极致系统优化;数据建设、指令微调、偏好对齐、模型优化;提升数据合成、Scalable Oversight、模型推理、规划能力,构建全面客观准确的评测体系,探索提升大模型能力; 3、探索突破包括而不限于多模态RAG,视觉COT与Agent等在内的多模态模型、世界模型进阶能力,构建GUI/游戏等虚拟世界的通用多模态Agent、应用; 4、利用预训练、仿真等技术对虚拟/现实世界的各类环境进行建模,提供多模态交互探索的基本能力,推动应用落地,研发以人工智能技术为核心的新技术、新产品。

更新于 2023-07-05