字节跳动【实习】抖音多业务场景的大模型训练与应用-抖音AI

实习兼职A373662026-04-15地点：北京状态：招聘

扫码手机上打开

任职要求

1、2027届及以后毕业，博士在读，计算机、软件工程、人工智能等相关专业背景；
2、优秀的问题分析与解决能力，能够深入解决大模型训练及应用中的复杂问题；
3、具备数据构建、指令微调及模型开发经验；
4、熟悉大模型相关技术，掌握相关训练推理框架，对大模型预训练、指令微调、Agent训练，RL等方向有深入研究和实践。

加分项
1、熟悉代码领…

登录查看完整任职要求

微信扫码，1秒登录

工作职责

团队介绍：抖音AI团队主要负责抖音项目以及团队内的AI落地相关基础建设工作。我们的职责是用前沿的AI技术去赋能抖音应用以及抖音团队。我们希望在AI技术的加持下，能够更好的给抖音用户带来更好的信息消费体验，也能够让抖音这个大型组织能够更加高效的运转，从而更加及时的满足用户的各项诉求。团队主要负责抖音AI基础建设，包括但不限于模型训练、Agent相关的工程链路开发、通用Agent工具抽象以及AI Native的各类产品开发工作。AGI信仰强，以发展成为AI Native组织为目标，努力拓展传统协作模式的职责边界，充分给同学们提供自身探索的空间。

课题介绍：抖音研发团队，负责抖音短视频、直播、中长视频、搜索、图文、音乐、社交通讯、医疗等业务技术开发，以及字节跳动旗下产品的客服平台、业务安全、用户增长、用户体验、抖音账号、AI技术研究与赋能等中台团队的研发工作。本次课题共涉及5个方向：
1、用户体验：抖音场景下的端侧大模型架构与推理加速体系研究；
2、抖音直播：迭代3D生成大模型，优化数据、编码和模型架构，提升3D资产生成效率和品质；
3、汽水音乐：聚焦音乐生成大模型的核心算法研究与优化，旨在攻克上述技术瓶颈，提升AI音乐创作的质量、可控性与创新性，赋能短视频配乐、虚拟偶像等多元应用场景；
4、AI技术研究与赋能：随着大模型在代码生成与软件开发中的应用不断深化，构建端到端AI Coding模型已成为提升研发效率的关键方向。本课题聚焦从数据构建、模型训练（SFT/RL）、到推理部署的全链路优化，探索从需求理解，代码生成与修复，与功能上线的一体化建模方法。重点解决领域知识注入、大规模SFT训练、Agentic RL等问题，推动AI在抖音等真实业务研发场景中的规模化落地；
5、小荷健康：围绕问诊、工具调用、科普与病例分析，提升医疗大模型任务规划与推理能力，保证结果准确稳定可用。

课题挑战：
1、资源约束极强，需兼顾算力、内存与功耗；通用性要求高，需支撑多业务场景高精度处理；面向差异化设备，实现任务复杂度的弹性适配；
2、高质量3D数据严重稀缺，3D几何与纹理表征复杂，生成质量与美术水准比仍有差距，当前链路冗长效率偏低；
3、音乐审美偏好的量化建模问题、长序列高品质音乐生成问题、多风格泛化与创新生成问题、推理增强方法的迁移应用问题；
4、抖音研发大模型需高效的业务知识注入，复杂且超长的上下文管理，解决高质量训练数据稀缺，Agentic RL的持续训练；
5、小荷健康围绕医疗场景基座模型 ，Agent Foundation构建与评测体系，强化模型复杂知识检索、任务分解及长链路执行能力。通过优化 SFT、RL、OPD等后训练方法的组合策略，兼顾模型效果、稳定性与泛化性。同时探究线上用户体验与基座模型训练间的关联，实现医疗大模型能力与实际应用效果的协同提升。

课题价值：
1、技术价值：等参数量级下，可大规模落地的业界领先模型；业务价值：提升抖音用户和业务接入的覆盖面，获得用户和营收价值；
2、技术上提升3D表征与生成能力，迭代3D生成大模型；业务上支撑直播和社交应用，产出丰富3D资产，满足海量用户的个性化需求；
3、技术上突破音乐生成在审美建模、长序列连贯性等核心瓶颈，引领AI音乐生成技术前沿；业务上提升抖音/汽水音乐的AI创作能力，降低音乐创作门槛，丰富内容生态，提供音乐内容供给；
4、技术上探索前沿模型训练策略，构建字节内部真实环境下的数据飞轮，提高业务研发效率，提升代码质量与性能；
5、技术上提升医疗大模型Agent与Post-Training方向的关键技术突破，提升问诊、科普、病例分析等核心场景业务效果，沉淀可复用的数据、训练与评测方法，支撑长期模型演进。

📮 投递简历 ✨AI模拟面试

难度：

包括英文材料

大模型+

AI agent+

ICML+

ICLR+

还有更多 •••

登录查看完整学习资料

相关职位

抖音多业务场景的大模型训练与应用-抖音AI

校招A143578A

团队介绍：抖音AI团队主要负责抖音项目以及团队内的AI落地相关基础建设工作。我们的职责是用前沿的AI技术去赋能抖音应用以及抖音团队。我们希望在AI技术的加持下，能够更好的给抖音用户带来更好的信息消费体验，也能够让抖音这个大型组织能够更加高效的运转，从而更加及时的满足用户的各项诉求。团队主要负责抖音AI基础建设，包括但不限于模型训练、Agent相关的工程链路开发、通用Agent工具抽象以及AI Native的各类产品开发工作。AGI信仰强，以发展成为AI Native组织为目标，努力拓展传统协作模式的职责边界，充分给同学们提供自身探索的空间。课题介绍：抖音研发团队，负责抖音短视频、直播、中长视频、搜索、图文、音乐、社交通讯、医疗等业务技术开发，以及字节跳动旗下产品的客服平台、业务安全、用户增长、用户体验、抖音账号、AI技术研究与赋能等中台团队的研发工作。本次课题共涉及5个方向： 1、用户体验：抖音场景下的端侧大模型架构与推理加速体系研究； 2、抖音直播：迭代3D生成大模型，优化数据、编码和模型架构，提升3D资产生成效率和品质； 3、汽水音乐：聚焦音乐生成大模型的核心算法研究与优化，旨在攻克上述技术瓶颈，提升AI音乐创作的质量、可控性与创新性，赋能短视频配乐、虚拟偶像等多元应用场景； 4、AI技术研究与赋能：随着大模型在代码生成与软件开发中的应用不断深化，构建端到端AI Coding模型已成为提升研发效率的关键方向。本课题聚焦从数据构建、模型训练（SFT/RL）、到推理部署的全链路优化，探索从需求理解，代码生成与修复，与功能上线的一体化建模方法。重点解决领域知识注入、大规模SFT训练、Agentic RL等问题，推动AI在抖音等真实业务研发场景中的规模化落地； 5、小荷健康：围绕问诊、工具调用、科普与病例分析，提升医疗大模型任务规划与推理能力，保证结果准确稳定可用。课题挑战： 1、资源约束极强，需兼顾算力、内存与功耗；通用性要求高，需支撑多业务场景高精度处理；面向差异化设备，实现任务复杂度的弹性适配； 2、高质量3D数据严重稀缺，3D几何与纹理表征复杂，生成质量与美术水准比仍有差距，当前链路冗长效率偏低； 3、音乐审美偏好的量化建模问题、长序列高品质音乐生成问题、多风格泛化与创新生成问题、推理增强方法的迁移应用问题； 4、抖音研发大模型需高效的业务知识注入，复杂且超长的上下文管理，解决高质量训练数据稀缺，Agentic RL的持续训练； 5、小荷健康围绕医疗场景基座模型，Agent Foundation构建与评测体系，强化模型复杂知识检索、任务分解及长链路执行能力。通过优化 SFT、RL、OPD等后训练方法的组合策略，兼顾模型效果、稳定性与泛化性。同时探究线上用户体验与基座模型训练间的关联，实现医疗大模型能力与实际应用效果的协同提升。课题价值： 1、技术价值：等参数量级下，可大规模落地的业界领先模型；业务价值：提升抖音用户和业务接入的覆盖面，获得用户和营收价值； 2、技术上提升3D表征与生成能力，迭代3D生成大模型；业务上支撑直播和社交应用，产出丰富3D资产，满足海量用户的个性化需求； 3、技术上突破音乐生成在审美建模、长序列连贯性等核心瓶颈，引领AI音乐生成技术前沿；业务上提升抖音/汽水音乐的AI创作能力，降低音乐创作门槛，丰富内容生态，提供音乐内容供给； 4、技术上探索前沿模型训练策略，构建字节内部真实环境下的数据飞轮，提高业务研发效率，提升代码质量与性能； 5、技术上提升医疗大模型Agent与Post-Training方向的关键技术突破，提升问诊、科普、病例分析等核心场景业务效果，沉淀可复用的数据、训练与评测方法，支撑长期模型演进。

更新于 2026-04-15杭州

AI Coding研发工程师实习生-抖音研发

实习A243620

日常实习：面向全体在校生，为符合岗位要求的同学提供为期3个月及以上的项目实践机会。团队介绍：抖音研发部门负责多款大型产品的研发，包括但不限于抖音、西瓜视频、汽水音乐。加入我们，你将有机会参与亿级用户场景的开发与架构工作，使用前沿的技术助力业务一起不断成长。 1、参与抖音AI创作团队AI Native研发工具建设，推动AI Native基建建设，协同产品、算法等团队提升用户体验； 2、参与抖音AI创作基建Agent开发，负责需求开发中代码生成效果、全流程交付效果，参与Agent框架建设、编排调度、上下文工程建设、模型适配等，提升需求交付效率； 3、参与评测、知识库、上下文管理等基础能力建设，对大模型应用效果进行持续调优，通过数据分析与策略改进，提升工具的性能和体验； 4、跟踪AI技术趋势，思考AI研发新范式、AI新技术在研发提效中的落地场景，驱动产品创新。

更新于 2026-05-25杭州

大模型工程实习生（代码方向）-抖音AI

实习A125182

ByteIntern：面向2027届毕业生（2026年9月-2027年8月期间毕业），为符合岗位要求的同学提供转正机会。团队介绍：抖音AI团队主要负责抖音项目以及团队内的AI落地相关基础建设工作。我们的职责是用前沿的AI技术去赋能抖音应用以及抖音团队。我们希望在AI技术的加持下，能够更好的给抖音用户带来更好的信息消费体验，也能够让抖音这个大型组织能够更加高效的运转，从而更加及时的满足用户的各项诉求。团队主要负责抖音AI基础建设，包括但不限于模型训练、Agent相关的工程链路开发、通用Agent工具抽象以及AI Native的各类产品开发工作。AGI信仰强，以发展成为AI Native组织为目标，努力拓展传统协作模式的职责边界，充分给同学们提供自身探索的空间。 1、负责代码大模型相关的数据收集、清洗、构建与管理，搭建高效稳定的数据处理Pipeline； 2、负责代码大模型评测体系的建设，包括评测集构建、评测框架开发与评测执行； 3、探索和实现基于大模型的智能体（Agent），应用于代码生成、Bug修复、测试用例生成等复杂研发任务； 4、持续追踪并复现LLM+SE领域前沿技术动态，并将其应用于实际业务场景中，推动技术落地。

更新于 2026-02-03北京

抖音内容AI数据服务运营（Agent方向）实习生-内容质量与数据服务平台

实习A143644

ByteIntern：面向2027届毕业生（2026年9月-2027年8月期间毕业），为符合岗位要求的同学提供转正机会。团队介绍：CQC（中国内容质量与数据服务平台）归属于抖音集团，负责今日头条、抖音、西瓜视频等产品内容和抖音集团商业内容的安全质量与体验，支持各产品的运营和增长，以及为产品线提供AI算法算力的基础支持服务。 1、基于抖音内容标签体系建设业务，挖掘可借助大模型自动标注或提效、提质的Agent搭建方向，推进标注场景数字人能力建设，探索自动化与工具化手段，持续提升标注及运营环节的效率与规模化能力； 2、联动产品、算法、运营等团队，基于业务数据和实际运营反馈快速迭代策略，借助工具和算法，通过自动化Workflow、Agent搭建等方式解决业务问题，参与构建可复用的数据标准化方案，及时识别风险并推动跨团队解决方案落地，助力业务目标达成。

更新于 2026-04-16北京