字节跳动智能对话大模型算法实习生-广告业务-筋斗云人才计划
任职要求
1、2026届及以后毕业,博士在读,人工智能、大模型、NLP相关专业优先; 2、优秀的代码能力、数据结构和基础算法功底,熟练C/C++或Python,ACM/ICPC、NOI/IOI、Top Coder、Kaggle等比赛获奖者优先; 3、扎实的机器学习、NLP、RL基础和出色的探索能力,在ACL/EMNLP/NAACL/NeurIPS/ICML/ICLR等顶级会议上发表论文者优先; 4、在大模型领域或者RL领域,主导过大影响力的项目或或论文者优先; 5、出色的问题分析和解决能力,有自主探索解决方案的能力;良好的沟通协作能力,能和团队一起探索新技术,推进技术进步; 6、要有改变世界的远大抱负于决心,要有迎接挑战与困难的勇气。
工作职责
团队介绍:广告业务原为商业产品与技术部门,为抖音集团的商业变现提供广告产品与技术,负责端到端大型广告系统建设,覆盖抖音、今日头条、西瓜视频、番茄小说、穿山甲等产品矩阵,践行“激发生意新可能”理念,致力于让营销更省心、更高效、更美好,推动商业的可持续增长,让不分体量、地域的企业及个体,都能通过数字化技术激发创造、驱动生意。连接广告主、用户及生态伙伴、成为开放共赢的全球最佳智能营销平台之一。在这里,你将投身建设面向未来的数字营销能力,接触到全球先进的商业产品架构、模型和算法,在互联网广告行业始终创新。 课题背景 在广告营销领域,智能客服系统正成为优化售前用户沟通的关键工具,商家亟需高效工具来减少人工依赖、提升转化效率。背景核心在于:广告营销的售前场景涉及复杂用户交互(如产品咨询、促销引导和留资获取),当前基于 LLM 的智能客服 Agent 系统采用 “规划 + 生成” 的架构,需完成从用户进线、诉求澄清到方案执行的全流程服务。然而,随着广告市场的动态变化和个性化需求增长,传统方法面临响应相关性不足、转化率瓶颈等问题。团队正聚焦于利用 LLM 后训练技术(如微调和强化学习),结合 RAG、CoT 蒸馏等手段,构建一套高适配性的 Agent 系统,以实现智能化用户沟通 —— 帮助商家自动促成订单或获取高质量线索,最终提升广告营销的 ROI 和用户体验。这一方向不仅是业务增长的核心驱动力,也是推动大模型在广告领域落地的关键创新。 课题挑战 本课题面临多重技术与业务挑战,需要人才在 LLM-Agent 架构下突破瓶颈,确保智能客服在广告营销场景中的高可靠性、高效性和合规性。具体挑战包括: 1)对话流程控制:售前咨询需通过多轮交互引导用户留资或促成订单,亟需优化 Agent 的决策能力。这要求强化planning的识别能力和action选择的准确性,需要引入 SOP 构建、CoT蒸馏、react与反思机制等,实现上下文一致性与业务目标达成。另外也需要构建合理的reward指标,应用DPO/RL等手段进一步提升模型决策能力; 2)回复质量与幻觉:售前咨询的回复模型需要在少量标注数据下产出高质量的训练数据,应用大模型微调SFT、CoT蒸馏提升在各个行业上的话术质量和回复满意度。应用RAG、知识图谱等能力构建高质量知识库,在线时通过精确知识点匹配解决冷启动与幻觉问题,提升用户体验; 3)个性化问题:目前传统智能客服对于不同用户的接待基本都是相同的,售前客服需要考虑不同用户的兴趣点,通过引入用户特征、构建长期memory等手段,为用户构建定制化的接待方案,提高用户满意度并促成留资或者订单等业务指标提升; 4)实时性能瓶颈:系统需处理高并发请求,但大模型的推理延迟和资源消耗可能影响用户体验。这要求研究模型压缩、量化技术、推理模型的cot加速等方向以优化部署效率。 研究方向:大语言模型。
团队介绍:广告业务原为商业产品与技术部门,为抖音集团的商业变现提供广告产品与技术,负责端到端大型广告系统建设,覆盖抖音、今日头条、西瓜视频、番茄小说、穿山甲等产品矩阵,践行“激发生意新可能”理念,致力于让营销更省心、更高效、更美好,推动商业的可持续增长,让不分体量、地域的企业及个体,都能通过数字化技术激发创造、驱动生意。连接广告主、用户及生态伙伴、成为开放共赢的全球最佳智能营销平台之一。在这里,你将投身建设面向未来的数字营销能力,接触到全球先进的商业产品架构、模型和算法,在互联网广告行业始终创新。 课题背景 在广告营销领域,智能客服系统正成为优化售前用户沟通的关键工具,商家亟需高效工具来减少人工依赖、提升转化效率。背景核心在于:广告营销的售前场景涉及复杂用户交互(如产品咨询、促销引导和留资获取),当前基于 LLM 的智能客服 Agent 系统采用 “规划 + 生成” 的架构,需完成从用户进线、诉求澄清到方案执行的全流程服务。然而,随着广告市场的动态变化和个性化需求增长,传统方法面临响应相关性不足、转化率瓶颈等问题。团队正聚焦于利用 LLM 后训练技术(如微调和强化学习),结合 RAG、CoT 蒸馏等手段,构建一套高适配性的 Agent 系统,以实现智能化用户沟通 —— 帮助商家自动促成订单或获取高质量线索,最终提升广告营销的 ROI 和用户体验。这一方向不仅是业务增长的核心驱动力,也是推动大模型在广告领域落地的关键创新。 课题挑战 本课题面临多重技术与业务挑战,需要人才在 LLM-Agent 架构下突破瓶颈,确保智能客服在广告营销场景中的高可靠性、高效性和合规性。具体挑战包括: 1)对话流程控制:售前咨询需通过多轮交互引导用户留资或促成订单,亟需优化 Agent 的决策能力。这要求强化planning的识别能力和action选择的准确性,需要引入 SOP 构建、CoT蒸馏、react与反思机制等,实现上下文一致性与业务目标达成。另外也需要构建合理的reward指标,应用DPO/RL等手段进一步提升模型决策能力; 2)回复质量与幻觉:售前咨询的回复模型需要在少量标注数据下产出高质量的训练数据,应用大模型微调SFT、CoT蒸馏提升在各个行业上的话术质量和回复满意度。应用RAG、知识图谱等能力构建高质量知识库,在线时通过精确知识点匹配解决冷启动与幻觉问题,提升用户体验; 3)个性化问题:目前传统智能客服对于不同用户的接待基本都是相同的,售前客服需要考虑不同用户的兴趣点,通过引入用户特征、构建长期memory等手段,为用户构建定制化的接待方案,提高用户满意度并促成留资或者订单等业务指标提升; 4)实时性能瓶颈:系统需处理高并发请求,但大模型的推理延迟和资源消耗可能影响用户体验。这要求研究模型压缩、量化技术、推理模型的cot加速等方向以优化部署效率。 研究方向:大语言模型。
团队介绍:Data-抖音团队,负责抖音APP的推荐算法、内容算法、对话算法及大数据工作,对接各场景业务(短视频,直播,图文,电商,社交,生态,投稿,消息,同城,生活服务,音乐,评论,内容理解&安全、智能对话等)。我们的工作涉及大规模推荐算法的优化、复杂约束的优化问题的解决、内容理解、LLM应用以及新业务方向探索、CV/NLP等多个学术领域的算法改进工作、对多种场景的推荐架构的设计和实现和对产品数据的复杂深入的分析工作。在这里,你可以深入钻研机器学习算法的改进和优化,探索工业界最领先的推荐系统架构和推荐大模型算法、可以通过使用最新的大模型等技术支持抖音的数字人、智能客服、AI工具等创新探索;可以通过对产品的深度理解和思考,将算法应用到业务中去;也可以通过对产品和内容生态的深度分析,影响产品未来的发展方向。 课题介绍: 自然语言领域LLM的出现,效果在众多垂直任务上都好于sota模型,从推荐领域看过去工业级推荐系统在较长的时间没有大幅的变化过。本项目旨在探索推荐领域下的大模型方案,改变现在持续了较长时间的推荐模型结构和Infra的基本范式,且效果大幅好于现在的模型,在抖音短视频/直播等多个业务场景上得到应用。但是怎么做好推荐领域的大模型也是一个比较有挑战的事情,推荐对工程效率的要求更高,且用户的推荐体验上是个性化的,以及如何短视频、直播等体裁上做号内容的表征也是需要被解决的问题,这里会从模型参数scaling up、内容和用户的表征学习、内容理解多模态、超长序列建模、生成式推荐模型等多个方向来做深入的研究,对推荐场景的模型做系统性的升级。 研究方向: 跨模态的对齐和统一表征学习(推荐、内容多模态、自然语言); 推荐模型参数和算力scaling up; 超长序列建模; 生成式推荐模型。
团队介绍:Data-抖音团队,负责抖音APP的推荐算法、内容算法、对话算法及大数据工作,对接各场景业务(短视频,直播,图文,电商,社交,生态,投稿,消息,同城,生活服务,音乐,评论,内容理解&安全、智能对话等)。我们的工作涉及大规模推荐算法的优化、复杂约束的优化问题的解决、内容理解、LLM应用以及新业务方向探索、CV/NLP等多个学术领域的算法改进工作、对多种场景的推荐架构的设计和实现和对产品数据的复杂深入的分析工作。在这里,你可以深入钻研机器学习算法的改进和优化,探索工业界最领先的推荐系统架构和推荐大模型算法、可以通过使用最新的大模型等技术支持抖音的数字人、智能客服、AI工具等创新探索;可以通过对产品的深度理解和思考,将算法应用到业务中去;也可以通过对产品和内容生态的深度分析,影响产品未来的发展方向。 课题介绍: 自然语言领域LLM的出现,效果在众多垂直任务上都好于sota模型,从推荐领域看过去工业级推荐系统在较长的时间没有大幅的变化过。本项目旨在探索推荐领域下的大模型方案,改变现在持续了较长时间的推荐模型结构和Infra的基本范式,且效果大幅好于现在的模型,在抖音短视频/直播等多个业务场景上得到应用。但是怎么做好推荐领域的大模型也是一个比较有挑战的事情,推荐对工程效率的要求更高,且用户的推荐体验上是个性化的,以及如何短视频、直播等体裁上做号内容的表征也是需要被解决的问题,这里会从模型参数scaling up、内容和用户的表征学习、内容理解多模态、超长序列建模、生成式推荐模型等多个方向来做深入的研究,对推荐场景的模型做系统性的升级。 研究方向: 跨模态的对齐和统一表征学习(推荐、内容多模态、自然语言); 推荐模型参数和算力scaling up; 超长序列建模; 生成式推荐模型。
1.跟进多模态大模型的最新研究进展和技术实现(包括但不限于视频理解、视频问答、视频caption等),将多模态大模型内容理解能力与广告业务相结合,提升广告模型匹配效率 2.跟进和研发基于扩散模型的图像生成、视频生成等前沿技术,用于广告图片、视频等创意素材的内容生成 3.跟进和研发大语言模型LLM的指令微调、RLHF 等技术,结合广告业务场景落地关键词提取、智能对话、广告标题或文案生成等多个下游任务 4.结合上述多模态理解和AIGC生成能力,构建自动化素材生产和投放优化平台,挖掘站内优质内容,自动化编辑、剪辑制作素材,并基于数据驱动优化素材投前、投中环节的效果