logo of amd

AMD大模型算法实习生(模型量化/低比特训练推理)Jan - Jun 2026

实习兼职地点:北京状态:招聘

任职要求


职位描述 研究和开发大模型优化算法,包括但不限于模型(如CNNLLM、Vision LLM等)的量化、剪枝、蒸馏、压缩等算法设计与实现,提高训练和推理性能 分析模型和数据类型特点,制定对应的推理优化与量化策略,鼓励创新和论文发表; 关注低比特数据类型的模型训练,分析和解决精度与性能问题 跟踪AI领域最新研究成果和技术动态(特别是大模型量化和推理加速技术),评估其在实际产品中的应用潜力和落地价值,提出改进和创新的想法,推动团队的技术发展。 职位要求 扎实的C/C++或者Python基础,熟悉至少一种深度学习框架(如PyTorchTensorFlowJAX等); 对AI算法和应用有深刻的理解,熟练掌握机器学习、深度学习、强化学习等理论知识,具备模型训练与部署的完整开发经验;或者有模型量化/剪枝/蒸馏/压缩相关科研或项目经验;或了解Flash Attenti…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


N/A
包括英文材料
大模型+
算法+
CNN+
C+
C+++
Python+
深度学习+
PyTorch+
TensorFlow+
JAX+
还有更多 •••
相关职位

logo of mi
实习

1. 负责大模型算法在手机、平板等移动设备平台部署,打造业界领先的全平台推理引擎 2. 分析性能瓶颈,提出系统性优化方案,将算法落地到汽车、手机、小爱等集团业务线 3. 设计先进的推理引擎架构,极致优化高性能算子与推理流水线 4. 了解移动端硬件特性,分析推理性能瓶颈,提出系统性解决方案 5. 充分挖掘硬件平台异构算力,优化资源占用 6. 负责AI项目交付、算法库开发、升级优化、技术文档撰写等工作

更新于 2025-12-09北京
logo of kuaishou
实习D7214

1、负责文生图、文生视频等自研大模型核心算子的自研开发与性能优化,基于CUDA、OpenAI Triton等工具实现高性能计算加速; 2、针对AI Infra大模型推理与训练场景,优化混合精度量化策略,设计低比特计算、稀疏化压缩等方案,提升模型部署效率; 3、深入GPU/Tensor Core硬件架构,优化显存管理、计算图调度及分布式通信,提升模型训练吞吐与资源利用率; 4、搭建端到端模型推理流水线,探索多模态生成任务下的算子融合、动态编译等创新优化手段; 5、协同算法团队完成模型轻量化落地,提供量化感知训练(QAT)、模型剪枝等技术支持。

更新于 2025-09-02北京
logo of kuaishou
实习D7214

1、负责文生图、文生视频等自研大模型核心算子的自研开发与性能优化,基于CUDA、OpenAI Triton等工具实现高性能计算加速; 2、针对AI Infra大模型推理与训练场景,优化混合精度量化策略,设计低比特计算、稀疏化压缩等方案,提升模型部署效率; 3、深入GPU/Tensor Core硬件架构,优化显存管理、计算图调度及分布式通信,提升模型训练吞吐与资源利用率; 4、搭建端到端模型推理流水线,探索多模态生成任务下的算子融合、动态编译等创新优化手段; 5、协同算法团队完成模型轻量化落地,提供量化感知训练(QAT)、模型剪枝等技术支持。

更新于 2025-09-24北京
logo of aliyun
实习阿里云研究型实习

专注于LLM post-training和agent相关算法研究,具体职责包括: 1、探索LLM可解释性 + 模型增量CPT/RL算法,提升语言模型在专业领域上的能力; 2、探索LLM可解释性 + 低比特量化算法,降低模型training/inference阶段计算成本; 3、探索agent 增强微调算法,提升模型在专业领域上端到端解决复杂任务的能力; 4、将相关算法研究成果发表在国际顶级会议上(ICLR/NeurIPS/ICML/ACL); 5、将相关算法研究成果应用于模型低比特量化、海外大模型业务中,显著提升阿里云通义千问模型服务效率和沙特等国家主权大模型线上效果。

更新于 2025-04-23杭州