字节跳动多模态大模型提效实习生-大模型数据服务中心

实习兼职A98802B2025-12-31地点：北京状态：招聘

扫码手机上打开

任职要求

1、本科及以上学历在读，计算机、人工智能、数学、工程等相关专业优先；
2、对多模态大模型或AIGC方向有浓厚兴趣，了解图像/视频/文本等相关任务优先；
3、具备良好…

登录查看完整任职要求

微信扫码，1秒登录

工作职责

日常实习：面向全体在校生，为符合岗位要求的同学提供为期3个月及以上的项目实践机会。
团队介绍：大模型数据服务中心，是抖音集团旗下为大模型业务提供数据、评估、运营等专业解决方案的团队，主要承接大模型数据生产、大模型评估及运营相关的业务，与研发、产品等团队紧密合作，在预训练、数据监督微调、模型强化学习、模型能力评估、产品运营等大模型全链路数据环节，共同推动模型能力持续提升与应用。

1、参与多模态任务的数据策略理解与任务拆解，支持图像、视频、人像、指令类等任务的数据规则设计与落地；
2、协助多模态数据生产流程建设，参与标注规范、质检标准与边界规则的整理与优化；
3、参与Prompt Engineering辅助标注、工程化标注及自动化提效实践，验证并支持方案落地；
4、支持数据质量监控与分析，协助定位标注冲突、规则模糊、模态不一致等问题，参与模型评测数据准备与错例分析，支持模型能力诊断与数据策路迭代；
5、协助沉淀任务文档、规则说明与案例材料，支持跨团队协作，有机会深度参与多模态大模型数据策略与交付体系建设，获得真实模型项目实践经验。

📮 投递简历 ✨AI模拟面试

难度：

包括英文材料

学历+

还有更多 •••

登录查看完整学习资料

相关职位

模型应用提效实习生-大模型数据服务中心

实习A124257A

ByteIntern：面向2026届毕业生（2025年9月-2026年8月期间毕业），为符合岗位要求的同学提供转正机会。团队介绍：大模型数据服务中心，是抖音集团旗下为大模型业务提供数据、评估、运营等专业解决方案的团队；主要承接大模型数据生产、大模型评估及运营相关的业务，与研发、产品等团队紧密合作，在预训练、数据监督微调、模型强化学习、模型能力评估、产品运营等大模型全链路数据环节，共同推动模型能力持续提升与应用。 1、负责设计和搭建数据生产与效果评测链路，基于Prompt Engineering与AI Agent技术，覆盖文本模型、多模态模型及AI应用等多场景； 2、负责大模型数据标注与效果评测工作，建设完整的评测体系，探索自动化标注及评测方法，并沉淀标准化的工作方法论； 3、运用Prompt Engineering技术搭建AI应用全流程，熟悉产品需求分析、技术方案设计到效果优化的完整研发流程，能够有效对接算法、工程和产品团队推进产品迭代； 4、通过技术分享和实践指导，提升数据团队对大语言模型及前沿技术的理解和应用能力，推动团队达成业务目标。

更新于 2025-09-01北京

音频多模态推理实习生-Seed大模型人才实习

实习A58356

团队介绍：字节跳动 Seed 团队成立于 2023 年，致力于寻找通用智能的新方法，追求智能上限，为科技和社会发展作出贡献。 Seed 团队在 AI 领域拥有长期愿景与决心，团队研究方向涵盖 MLLM、GenMedia、AI for Science、机器人等，在中国、新加坡、美国等地设有实验室和岗位。目前，团队已推出业界领先的通用大模型以及前沿的多模态能力，支持豆包、即梦、TRAE 等超过 50 个应用场景，并通过火山引擎开放给企业客户。第三方数据显示，豆包 App 用户量在中国市场排名第一，豆包大模型日均 Token 调用量行业领先。 1、负责音视频多模态场景大模型推理的性能优化，开发和优化多模态场景的推理系统，确保离在线推理性能达到业界领先水平； 2、与算法同学深度合作，开展算法与训推系统的联合深度优化，支撑部门前沿技术的探索及落地； 3、负责机器学习系统前瞻技术的调研与引入，持续提升部门关键技术竞争力，涵盖高性能推理框架、模型压缩等方向。

更新于 2026-03-30北京

视频创作多模态大模型实习生-智能创作-筋斗云人才计划

实习A52415

团队介绍：智能创作团队是字节跳动的创作场景业务中台，以AI赋能创造，致力于通过AI技术降低创作门槛，赋能视觉内容生产与创作的智能化升级。团队深度支持抖音、剪映、即梦、豆包、商业化等多个业务线，持续深耕图片与视频生成、智能剪辑、数字人、特效等多个业务场景，通过由AI驱动的智能化工具与算法，为用户提供了更智能、更便捷、更丰富的创作体验，助力普通用户轻松实现高质量内容创作，同时为专业创作者提供强大的技术支持，推动内容生态的繁荣与创新。课题介绍：背景：视频创作是内容平台生态的最关键环节。随着AGI大模型技术的发展，行业内AI视频创作Workflow不断革新，传统的视频剪辑工具面临严峻行业挑战。AI Native视频创作大模型技术，旨在研发一套基于大模型的视频创作系统，来改善用户创作过程中灵感匮乏、创作提质提效及降低门槛使人人都是优质创作者等难点问题。应用上，可落地支持抖音、剪映Capcut、Flow等业务的图片与视频创作工具，形成公司关键业务场景的核心生态壁垒。课题挑战： 1、中长视频多模态理解能力：创作场景需要对用户素材充分理解，因此大模型需要对输入视频的画面、声音及语音等能充分理解，具备素材剪辑处理的通用理解能力； 2、创作领域专业Agent能力: 大模型需要具备创作领域AGI的潜力，对于营销、UGC、PGC等不同创作场景，模型需要具备优质视频创作知识储备，能基于原子能力Tools规划合理的Action Sequence完成创作； 3、多模态输出能力：在视频创作领域，需要进行视频效果包装，因此模型需要具备输出音效/声音/文字贴纸/转场特效等能力； 4、高效率模型推理：由于输入视频时长较长，任务复杂，考虑应用落地成本，模型在处理长Context的推理效率与实际效果的Trade-off依赖技术突破。

更新于 2025-02-28深圳

视频创作多模态大模型实习生-智能创作-筋斗云人才计划

实习A108475A

更新于 2025-02-26北京