logo of kuaishou

快手大模型推理优化实习生-【游戏事业部】

实习兼职D8039地点:杭州状态:招聘

任职要求


1、硕士及以上学历,计算机/电子/自动化/人工智能等相关专业;
2、扎实的代码能力、数据结构和基础算法功底,熟练掌握 PythonC/C++;
3、熟悉常见的LLM推理优化方案,包括但不限于 Continuous Batching、FlashAttention、MLA,量化,剪枝、PD 分离、投机采样等;
4、熟悉 GPU 体系结构及相关高性能计算加速技术,了解常用的 CUDA 优化方…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1、协助大模型(LLM、扩散等)在云端的服务部署和推理加速优化;
2、参与AI模型端侧部署能力建设:利用 TensorRT、ONNX Runtime、MNN、OPENVINO 等端侧推理框架构建跨系统(如Linux,Windows,Android,IOS)、跨硬件平台(如 CPU、GPU、NPU )的模型端侧部署和推理加速能力,同时保障模型部署在多场景下的稳定性与兼容性;
3、完成团队其它AI工程化相关的工作;
4、跟踪业内最新的研究进展和技术趋势,提出改进和创新的想法,推动团队技术发展。
包括英文材料
学历+
数据结构+
算法+
Python+
C+
C+++
大模型+
还有更多 •••
相关职位

logo of cainiao
实习菜鸟集团2026

1、负责动态图优化、算子优化,Auto-Tuning、量化训练、模型推理部署、大模型训练等,提升训练的性能,降低算法的在线时延; 2、研发自动驾驶的高性能推理系统框架,支持GPU/CPU的异构推理; 3、追踪自动驾驶行业和深度学习技术的最新进展,力争打造菜鸟无人驾驶系统,开创未来无人物流的新格局。

更新于 2025-04-01杭州
logo of lilith
实习算法模型

探索多模态大模型与Agent 技术在游戏研发、运营及玩家生态中的前沿应用。在这里,你将在资深工程师的指导下,参与现有 AI 产品的维护与持续迭代,并深度参与核心 AI 系统的架构设计,利用大模型技术为游戏业务深度提效。 主要职责: 1. 产品迭代与应用维护:在指导下跟进并负责现有 AI 产品的日常维护与功能迭代。通过数据回流与 Badcase 分析,持续优化 Prompt 策略与模型表现,保障并提升业务场景下的模型产出质量。 2. 多模态大模型探索与落地:探索视觉语言模型(VLM)等多模态技术在游戏业务中的应用。例如:结合图文或音视频流,实现游戏内的bug识别,内容安全审核等功能。 3. Agent 系统架构设计:深度参与 Agent 系统的设计与开发。研究多智能体协同、复杂工具调用、动态规划和长短期记忆管理,打造能帮助业务方提效的agent工作流。 4. 大模型服务部署与工程优化:参与模型的推理加速与工程落地。基于 vLLM / TensorRT-LLM 等框架进行模型服务化,配合团队完成微服务架构下的 AI 接口封装、Docker 容器化部署以及高并发场景下的性能调优。

更新于 2026-04-21上海
logo of bytedance
实习A171437

日常实习:面向全体在校生,为符合岗位要求的同学提供为期3个月及以上的项目实践机会。 团队介绍:字节跳动 Seed 团队成立于 2023 年,致力于寻找通用智能的新方法,追求智能上限。团队研究方向涵盖 LLM、语音、视觉、世界模型、基础架构、AI Infra、下一代 AI 交互等,在中国、新加坡、美国等地设有实验室和岗位。 Seed 团队在 AI 领域拥有长期愿景与决心,坚持深耕基础,期望成为世界一流的 AI 研究团队,为科技和社会发展作出贡献。目前团队已推出业界领先的通用大模型以及前沿的多模态能力,支持豆包、扣子、即梦等超过 50 个应用场景。 1、探索应用多模态理解、生成式、机器学习、强化学习、AIGC、计算机视觉、人工智能等前沿技术; 2、探索大规模/超大规模多模态理解与生成交织的基础模型,并进行极致系统优化;数据建设、指令微调、偏好对齐、模型优化;提升数据合成、Scalable Oversight、模型推理、规划能力,构建全面客观准确的评测体系,探索提升大模型能力; 3、探索突破包括而不限于多模态RAG,视觉COT与Agent等在内的多模态模型、世界模型进阶能力,构建GUI/游戏等虚拟世界的通用多模态Agent、应用; 4、利用预训练、仿真等技术对虚拟/现实世界的各类环境进行建模,提供多模态交互探索的基本能力,推动应用落地,研发以人工智能技术为核心的新技术、新产品。

更新于 2023-03-29上海
logo of bytedance
实习Z3823A

ByteIntern:面向2026届毕业生(2025年9月-2026年8月期间毕业),为符合岗位要求的同学提供转正机会。 团队介绍:字节跳动 Seed 团队成立于 2023 年,致力于寻找通用智能的新方法,追求智能上限。团队研究方向涵盖 LLM、语音、视觉、世界模型、基础架构、AI Infra、下一代 AI 交互等,在中国、新加坡、美国等地设有实验室和岗位。 Seed 团队在 AI 领域拥有长期愿景与决心,坚持深耕基础,期望成为世界一流的 AI 研究团队,为科技和社会发展作出贡献。目前团队已推出业界领先的通用大模型以及前沿的多模态能力,支持豆包、扣子、即梦等超过 50 个应用场景。 1、探索应用多模态理解、生成式、机器学习、强化学习、AIGC、计算机视觉、人工智能等前沿技术; 2、探索大规模/超大规模多模态理解与生成交织的基础模型,并进行极致系统优化;数据建设、指令微调、偏好对齐、模型优化;提升数据合成、Scalable Oversight、模型推理、规划能力,构建全面客观准确的评测体系,探索提升大模型能力; 3、探索突破包括而不限于多模态RAG,视觉COT与Agent等在内的多模态模型、世界模型进阶能力,构建GUI/游戏等虚拟世界的通用多模态Agent、应用; 4、利用预训练、仿真等技术对虚拟/现实世界的各类环境进行建模,提供多模态交互探索的基本能力,推动应用落地,研发以人工智能技术为核心的新技术、新产品。

更新于 2023-04-19北京