字节跳动多模态大模型优化实习生-Data AML

实习兼职A1818642026-04-17地点：杭州状态：招聘

扫码手机上打开

任职要求

1、2027届硕士及以上学位在读，计算机/人工智能/软件工程相关专业优先；
2、实习时间6个月以上，具备优秀的编程能力，扎实的数据结构和基础算法功底，熟练掌握Python，熟悉深度学习框架（如PyTorch），有CUDA/Triton使用经验者优先；
3、在计算机视觉、深度学习领域顶级期刊或会议（如CVPR、ICCV、NeurIPS、PAMI等）发表过论文者优先；对扩散模型、视觉Transformer或生成式A…

登录查看完整任职要求

微信扫码，1秒登录

工作职责

ByteIntern：面向2027届毕业生（2026年9月-2027年8月期间毕业），为符合岗位要求的同学提供转正机会。
团队介绍：Data AML是字节跳动的机器学习中台，为抖音/今日头条/西瓜视频等业务提供推荐/广告/CV/语音/NLP的训练和推理系统。为公司内业务部门提供强大的机器学习算力，并在这些业务的问题上研究一些具有通用性和创新性的算法。同时，也通过火山引擎将一些机器学习/推荐系统的核心能力提供给外部企业客户。

1、深度参与业界效果领先的生成模型Seedance/Seedream相关工作，理解模型Seed-VLM的软硬件协同优化和算法优化逻辑，构建业界领先的模型优化能力矩阵；
2、研发面向多端异构平台的量化&稀疏、MOE压缩、Token压缩、Cache复用、投机解码、KV Cache压缩等加速算法，构建Training-Free或结合Post-Training/RL-Training的加速算法能力；
3、面向分布式训练/推理场景，深度挖掘模型表示位宽、分辨率、步数、结构等维度的冗余，通过算法和工程创新加速训练和推理过程，实现降本增效；
4、探索Efficient AIGC、Efficient LLM领域最前沿的问题，包括多模态理解生成统一建模加速、结合RL训练的模型优化等方向。

📮 投递简历 ✨AI模拟面试

难度：

包括英文材料

学历+

数据结构+

算法+

Python+

深度学习+

PyTorch+

CUDA+

Triton Inference Server+

还有更多 •••

登录查看完整学习资料

相关职位

多模态大模型推理算子优化实习生-Data AML

实习A121852

ByteIntern：面向2027届毕业生（2026年9月-2027年8月期间毕业），为符合岗位要求的同学提供转正机会。团队介绍：Data AML是字节跳动的机器学习中台，为抖音/今日头条/西瓜视频等业务提供推荐/广告/CV/语音/NLP的训练和推理系统。为公司内业务部门提供强大的机器学习算力，并在这些业务的问题上研究一些具有通用性和创新性的算法。同时，也通过火山引擎将一些机器学习/推荐系统的核心能力提供给外部企业客户。 1、深度参与业界先进开源LLM/VLM模型的推理优化部署，构建业界领先的模型推理优化能力； 2、负责完善不同芯片的推理适配和优化技术体系，提升大模型x芯片类型矩阵的适配与优化效率； 3、负责新型异构芯片在多种大模型上的分析评估工作； 4、负责前沿技术的调研评估和引进落地，例如前沿论文中的推理加速技术、软硬协同优化、新异构硬件特性等。

更新于 2026-04-16北京

多模态大模型性能优化实习生

实习核心本地商业-基

1. 分析业务多模态模型计算性能瓶颈，资源利用率情况，制定算法或者工程方案，提高模型的计算性能、优化资源利用率。 2. 通过模型压缩蒸馏、高性能算子开发、分布式计算或虚拟化部署等方式，持续优化业务的多模态模型性能和资源利用率。 3. 将模型优化的技术沉淀为可服用的工具链或者平台，支持算法和业务自动化、高效的完成模型优化。 4. 持续调研业界前沿的多模态模型推理性能优化技术，编写清晰的技术文档，分享优化经验，支持团队技术能力的提升。

更新于 2025-12-01北京

研究型实习生-多模态大模型软硬协同优化

实习阿里云研究型实习

1、负责研究AI大模型的推理性能优化算法，优化大模型推理部署的算力和访存瓶颈，提升AI模型在GPU、AI加速器等硬件上部署性能效率，推动大模型普惠应用和高性价比的竞争力； 2、负责高性能软硬结合的大模型推理优化方法研究，在AI类业务场景尤其是大模型场景下，通过结合模型算法和硬件来充分挖掘软硬件协同的组合优化潜力，带来高价值的性能和成本优势； 3、负责研发业界SOTA的多模态大模型计算性能优化方法创新，增强技术壁垒，并在云的商业业务中产生核心价值。

更新于 2025-10-14杭州

研究型实习生-多模态大模型软硬协同优化

实习阿里巴巴研究型实

更新于 2026-03-17杭州