商汤研究院-大模型部署压缩实习生

实习兼职技术族-实习2025-05-09地点：北京状态：招聘

扫码手机上打开

任职要求

1.熟练掌握Python或C++，git等工具。
2.了解目前主流的模型及结构，熟悉分类、检测、分割或LLM等模型在各个领域的应用。
3.了解模型优化加速方案，熟悉模型在线量化、离线量化、稀疏等算法原理和实现细节，并且了解硬件（GPU、DSP等)对于模型加速的支持方案。
4.熟悉模型部署相关流程，如有…

登录查看完整任职要求

微信扫码，1秒登录

工作职责

1. 通过分析模型与部署硬件特点，使用软硬结合的优化方案提升模型的速度与精度表现。
2. 针对AIGC模型（Stable Diffusion / LLM），使用SOTA算法提升模型压缩性能，助力大模型在各个产品线中的应用。
3. 负责自动驾驶、手机等多种场景及对应各异的芯片上，提升深度学习模型部署量化表现。
4. 负责开发和维护模型量化部署工具链，对齐硬件单元的量化部署细节。
5. 调研、复现业界最新的算法，集成工具，并在实际业务中落地；算法设计，论文发表。

📮 投递简历 ✨AI模拟面试

难度：

包括英文材料

Python+

C+++

Git+

大模型+

还有更多 •••

登录查看完整学习资料

相关职位

研究院-模型压缩算法实习生

实习算法研究

工作职责 1.负责模型压缩算法的研发和实现，包括但不限于模型量化、剪枝、蒸馏等 2.负责业务模型在多种场景及对应各异的芯片上的压缩精度提升和保持，包括AIGC(LLM/Stable Diffusion)模型，自动驾驶模型、手机端侧模型等 3.负责开发和维护LLM量化部署工具链，调研、复现业界最新的算法，集成工具，并在实际业务中落地,助力大模型在各个产品线中的应用 4.通过分析模型与部署硬件特点，使用软硬结合的优化方案提升模型的速度与精度表现，提升模型压缩能力上限

更新于 2025-05-09北京|成都|上海

26届AI领航员-研究院-大模型算法研究员（模型压缩）

校招算法研究

1. 负责模型压缩算法的研发和实现，包括但不限于模型量化、剪枝、蒸馏等； 2. 负责业务模型在多种场景及对应各异的芯片上的压缩精度提升和保持，包括AIGC(LLM / Stable Diffusion)模型，自动驾驶模型、手机端侧模型等； 3. 负责开发和维护LLM量化部署工具链，调研、复现业界最新的算法，集成工具，并在实际业务中落地, 助力大模型在各个产品线中的应用； 4. 通过分析模型与部署硬件特点，使用软硬结合的优化方案提升模型的速度与精度表现，提升模型压缩能力上限。

更新于 2025-08-21北京|上海|深圳

AI大模型算法工程师- 26届蓝极星

校招

vivo AI研究院致力于研发业界领先的人工智能技术，通过AI技术创新持续为全球5亿+vivo用户带来无处不在的惊喜和激动人心的智慧体验。 1、围绕多模态大模型的前沿研究，聚焦跨模态融合、知识推理与表达等核心问题，推动视觉、语音、文本等多模态智能体的理论和算法创新； 2、主导大模型端侧化与高效部署技术攻关，聚焦模型轻量化算法：量化、压缩、剪枝、蒸馏，以及模型推理加速、端侧模型训练等前沿课题，推动大模型在移动终端和边缘设备的实际落地； 3、深入探索强化学习与奖励模型的新范式，致力于提升泛化性和自学习能力，推动基于自博弈（Self-Play）的下一代智能体训练方法； 4、推动生成-理解统一建模、多模态世界模型构建等创新方向，实现虚拟与现实环境中的多模态交互与理解； 5、参与国际顶级学术会议/期刊论文发表，推动前沿技术在实际产品中的转化，提升公司在AI领域的学术与产业影响力。

更新于 2025-06-14深圳|杭州

达摩院-具身智能大模型研发工程师-北京/杭州

社招1年以下技术类-算法

我们正在构建面向下一代机器人智能的具身智能大模型（Embodied Foundation Model），致力于实现机器人在真实世界中的自主感知、理解、规划与操作能力。本岗位将参与具身感知、具身规划与操作基础模型的研发，包括多模态理解、3D空间建模、机器人决策推理以及大规模仿真训练等核心方向。你将与算法工程师、机器人系统工程师以及规控工程师团队密切合作，推动具身智能从模拟环境走向真实世界应用。以下方向可根据候选人背景匹配（不限于）： 1. 具身感知基础模型 ○ 多模态视觉语言模型（Vision-Language Model） ○ 3D感知建模（Depth / Occupancy / NeRF / Scene Graph） ○ 视频理解与时序建模 ○ 开放世界场景理解（Open-world Perception） 2. 具身规划与决策大模型 ○ 长时序任务规划（Long-horizon Planning） ○ LLM + Robotics 推理系统 ○ Tool-use 与 Agent 系统设计 ○ 多机器人协同决策 3. 具身操作基础模型 ○ 视觉-语言-动作模型 (VLA) 以及视频-动作模型（Video-Action Model） ○ 模仿学习 (Behavior Cloning, DAgger等) ○ Offline & Online Reinforcement Learning ○ 多来源数据融合（Human + Robot + Simulation） 4. 大规模仿真与Scaling Law验证 ○ GPU大规模并行仿真 ○ Sim2Real迁移 ○ 数据生成与自动标注系统 ○ Scaling Law验证与数据效率研究 5. 推理优化与系统方向 ○ 大模型推理加速 ○ 多GPU/多节点训练 ○ 模型压缩与蒸馏 ○ 机器人端侧部署优化岗位职责： ● 参与具身智能基础模型算法设计与研发 ● 构建机器人多模态数据训练体系 ● 推动模型在真实机器人平台上的落地验证 ● 跟踪前沿研究进展并推动技术创新 ● 与跨团队协作完成系统级集成

更新于 2026-03-27北京|杭州