logo of bytedance

字节跳动抖音多业务场景的大模型训练与应用-抖音AI

校招全职A143578A地点:杭州状态:招聘

任职要求


1、2027届毕业,获得博士学位,计算机、软件工程、人工智能等相关专业;
2、优秀的问题分析与解决能力,能够深入解决大模型训练及应用中的复杂问题;
3、具备数据构建、指令微调及模型开发经验;
4、熟悉大模型相关技术,掌握相关训练推理框架,对大模型预训练、指令微调、Agent训练、RL等方向有深入研究和实践。

加分项
1、熟悉代码领域…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


团队介绍:抖音AI团队主要负责抖音项目以及团队内的AI落地相关基础建设工作。我们的职责是用前沿的AI技术去赋能抖音应用以及抖音团队。我们希望在AI技术的加持下,能够更好的给抖音用户带来更好的信息消费体验,也能够让抖音这个大型组织能够更加高效的运转,从而更加及时的满足用户的各项诉求。团队主要负责抖音AI基础建设,包括但不限于模型训练、Agent相关的工程链路开发、通用Agent工具抽象以及AI Native的各类产品开发工作。AGI信仰强,以发展成为AI Native组织为目标,努力拓展传统协作模式的职责边界,充分给同学们提供自身探索的空间。

课题介绍:
抖音研发团队,负责抖音短视频、直播、中长视频、搜索、图文、音乐、社交通讯、医疗等业务技术开发,以及字节跳动旗下产品的客服平台、业务安全、用户增长、用户体验、抖音账号、AI技术研究与赋能等中台团队的研发工作。本次课题共涉及5个方向:
1、用户体验:抖音场景下的端侧大模型架构与推理加速体系研究;
2、抖音直播:迭代3D生成大模型,优化数据、编码和模型架构,提升3D资产生成效率和品质;
3、汽水音乐:聚焦音乐生成大模型的核心算法研究与优化,旨在攻克上述技术瓶颈,提升AI音乐创作的质量、可控性与创新性,赋能短视频配乐、虚拟偶像等多元应用场景;
4、AI技术研究与赋能:随着大模型在代码生成与软件开发中的应用不断深化,构建端到端AI Coding模型已成为提升研发效率的关键方向。本课题聚焦从数据构建、模型训练(SFT/RL)、到推理部署的全链路优化,探索从需求理解,代码生成与修复,与功能上线的一体化建模方法。重点解决领域知识注入、大规模SFT训练、Agentic RL等问题,推动AI在抖音等真实业务研发场景中的规模化落地;
5、小荷健康:围绕问诊、工具调用、科普与病例分析,提升医疗大模型任务规划与推理能力,保证结果准确稳定可用。

课题挑战:
1、资源约束极强,需兼顾算力、内存与功耗;通用性要求高,需支撑多业务场景高精度处理;面向差异化设备,实现任务复杂度的弹性适配;
2、高质量3D数据严重稀缺,3D几何与纹理表征复杂,生成质量与美术水准比仍有差距,当前链路冗长效率偏低;
3、音乐审美偏好的量化建模问题、长序列高品质音乐生成问题、多风格泛化与创新生成问题、推理增强方法的迁移应用问题;
4、抖音研发大模型需高效的业务知识注入,复杂且超长的上下文管理,解决高质量训练数据稀缺,Agentic RL的持续训练;
5、小荷健康围绕医疗场景基座模型 ,Agent Foundation构建与评测体系,强化模型复杂知识检索、任务分解及长链路执行能力。通过优化 SFT、RL、OPD等后训练方法的组合策略,兼顾模型效果、稳定性与泛化性。同时探究线上用户体验与基座模型训练间的关联,实现医疗大模型能力与实际应用效果的协同提升。

课题价值:
1、技术价值:等参数量级下,可大规模落地的业界领先模型;业务价值:提升抖音用户和业务接入的覆盖面,获得用户和营收价值;
2、技术上提升3D表征与生成能力,迭代3D生成大模型;业务上支撑直播和社交应用,产出丰富3D资产,满足海量用户的个性化需求;
3、技术上突破音乐生成在审美建模、长序列连贯性等核心瓶颈,引领AI音乐生成技术前沿;业务上提升抖音/汽水音乐的AI创作能力,降低音乐创作门槛,丰富内容生态,提供音乐内容供给;
4、技术上探索前沿模型训练策略,构建字节内部真实环境下的数据飞轮,提高业务研发效率,提升代码质量与性能;
5、技术上提升医疗大模型Agent与Post-Training方向的关键技术突破,提升问诊、科普、病例分析等核心场景业务效果,沉淀可复用的数据、训练与评测方法,支撑长期模型演进。
包括英文材料
学历+
大模型+
AI agent+
ICML+
还有更多 •••
相关职位

logo of bytedance
社招3年以上A141870C

1、负责抖音AI分身相关业务的策略产品工作,优化AI生成式内容&短视频&图文&推荐策略,极致优化用户体验、提高对话质量和效率; 2、深入挖掘用户需求,洞察用户与AI生成式服务匹配关系,设计对用户长期价值和用户功能心智有收益的互动策略; 3、与模型算法,推荐技术等团队紧密合作,完成需求分析,方案设计,并推进策略迭代,落地; 4、对AI行业有热爱,对AI技术熟悉,特别是LLM方向。

更新于 2024-03-14上海
logo of bytedance
社招A131227A

团队介绍:字节跳动抖音搜索团队主要负责抖音搜索算法创新和架构研发工作,主要包括短视频、直播、本地生活、视觉搜索等多个业务线。我们使用最前沿的机器学习技术进行端到端建模并不断创新突破,同时专注于分布式系统、机器学习系统的构建和性能优化,从内存、Disk等优化到索引压缩、召回、排序等算法的探索,充分给同学们提供成长自我的机会。主要工作方向包括:1、探索前沿的NLP技术:从基础的分词、NER,到应用上的Query分析、基础相关性等,全链路应用深度学习模型,每个细节都充满挑战;2、跨模态匹配技术:在搜索中应用CV+NLP深度学习技术,让视频搜索拥有更强大的检索能力;3、大规模流式机器学习技术:应用大规模机器学习,解决搜索中的推荐问题,让搜索更加个性化更加懂你;4、千亿级数据规模的架构:从大规模离线计算,分布式系统的性能、调度优化,到构建高可用、高吞吐和低延迟的在线服务的方方面面都有深入研究和创新。 1、支持抖音AI搜/豆包等原生LLM应用的电商需求,负责大模型应用相关的数据建设、模型微调/对齐、RAG、规划Planning、Memory等工作; 2、支持大模型技术改进现有的电商搜索,探索大模型下的新搜索引擎设计,包括LLM适性的索引、基于LLM的相关性、生成式召回、排序大模型等; 3、探索AI找搭配/虚拟穿搭等AIGC创新应用。

更新于 2025-02-12杭州
logo of bytedance
社招R4032

团队介绍:抖音AI分身是抖音创作者的AI数字分身形象,作为一种可以在多个产品容器内作用的新能力,是AI大模型在抖音业务创新应用落地的重要场景。 1、负责AI分身在抖音多场景的分发,包括推荐Feed分发AI分身新体裁,AI分身头像视频等; 2、与大模型算法团队合作,探索推荐和大模型在实际应用中的结合,比如引导词推荐提升AI分身的对话效果,推荐提升大模型的对话能力等; 3、和产品、运营团队紧密合作,通过对产品和用户的深入理解和分析,制定算法策略,促进AI分身生态的长期繁荣发展。

更新于 2022-06-02深圳
logo of bytedance
社招3年以上A130659

1、负责抖音AI搜索增长方向策略产品工作,在抖音端内寻找合适的AI搜索应用场景,对AI搜索的规模指标负责; 2、通过数据分析和策略分析,输出有价值的策略优化方案,持续迭代各入口转化; 3、深入洞察用户需求与AI生成式能力、抖音内容生态的结合,不断开展产品创新思考; 4、与模型算法、工程技术、评测等团队紧密合作,完成策略迭代、效果评测、产品功能上线等落地项目。

更新于 2024-07-17北京