logo of bytedance

字节跳动智能对话大模型算法实习生-电商智能对话-筋斗云人才计划(北京/上海/杭州/珠海)

实习兼职A222718地点:上海状态:招聘

任职要求


1、2026届及之后毕业,博士在读,计算机、软件、人工智能、数学等相关专业优先;
2、扎实的机器学习基础,深入理解深度学习、多模态模型及生成模型等技术,具备良好的数理基础和自学能力;
3、熟练掌握相关机器学习框架和工程框架,具备扎实的编码能力;
4、在多模态大模型领域有相关经验,尤其在长文本、影视剧领域有经验者优先;
5、在计算机科学高水平会议和期刊(如NIPS、ICMLCVPRICCVECCV、IJCAI、AAAI、KDD、SIGIR、WWW、ACL、TPAMI、IJCV等)发表过论文或具备竞赛经验者优先。

工作职责


团队介绍:Data-电商-智能对话团队,致力于打造业界领先的大模型对话系统。团队服务的日活用户超过数亿,应用场景覆盖抖音电商全链路,包括平台客服、平台商服、商家客服、达人客服,以及创新的智能导购等核心业务场景,通过持续的技术创新和优化,成功构建了一套完整的智能对话解决方案,为电商业务带来了显著的效率提升和用户体验改善。

课题介绍:
背景:电商智能客服正逐渐成为业务增长和用户体验优化的重要方向,基于大型语言模型(LLM)的智能客服系统解决电商场景中的核心挑战,由LLM完成一次用户进线的完整接待过程,包括诉求澄清、方案协商、方案执行等阶段,实现电商业务的智能化升级——让用户享受更智能高效的客服服务。
研究方向:本课题聚焦于LLM 后训练与智能客服。构建基于 LLM 的多智能体(Multi-Agent)框架,通过规划、回复、工具三类Agent的协作,实现从问题分析、方案执行到结果反馈的全流程智能客服。核心目标是确保客服对话的准确性、合规性与流畅度,避免模型生成幻觉或违背平台政策。同时,围绕电商客服的复杂任务,构建 Benchmark数据集,优化SOP遵循、多轮交互、用户满意度等指标。此外,研究高效数据利用方法,探索低标注数据条件下的LLM训练,并开发自动生成高质量训练数据的系统,以降低人工标注成本,提高智能客服的服务质量与效率。

1、数据挖掘:负责数据集的构建与维护,利用数据飞轮机制不断优化数据质量和丰富度,进行深度的数据挖掘,沉淀高价值信息;
2、大模型训练:针对业务需求进行大模型的继续训练(CT)、有监督微调(SFT)、偏好学习,以及多模态模型训练,提升模型在特定场景下的表现;
3、提示词工程:与业务专家合作,构建和优化结构化的提示词,充分挖掘和利用大模型的能力,高效、精准解决实际问题;
4、信息检索:开发和优化Query理解、召回、相关性排序等技术,提升信息检索的效率和准确性,提升RAG的效果;
5、智能体技术:利用领先的智能体框架,增强大模型的推理、对话和反思能力,解决复杂业务问题,提升用户体验;
6、大模型评测:制定和实施大模型的评估方案,结合人工评估和自动化评估手段,确保模型性能的可靠性和稳定性;
7、应用落地:定义业务问题,设定任务标准和目标,不断优化模型和系统,以达到最佳的业务效果和用户满意度。
包括英文材料
机器学习+
深度学习+
大模型+
ICML+
CVPR+
ICCV+
ECCV+
相关职位

logo of bytedance
实习A230707

ByteIntern:面向2026届毕业生(2025年9月-2026年8月期间毕业),为符合岗位要求的同学提供转正机会。 团队介绍:Data-电商-智能对话团队,负责抖音电商场景下的智能对话与问答技术的创新和研究工作,致力于打造客服领域内领先的智能对话机器人,帮助平台和商家高效、准确地解决用户问题提升用户体验,降低平台/商家运维成本,不断提升业务效果。 1、数据挖掘:负责数据集的构建与维护,利用数据飞轮机制不断优化数据质量和丰富度,进行深度的数据挖掘,沉淀高价值信息,开发和优化Query理解、召回、相关性排序等技术,提升信息检索的效率和准确性,提升RAG的效果; 2、大模型训练:针对业务需求进行大模型的继续训练(CT)、有监督微调(SFT)、偏好学习,以及多模态模型训练,提升模型在特定场景下的表现; 3、提示词工程:与业务专家合作,构建和优化结构化的提示词,充分挖掘和利用大模型的能力,高效、精准解决实际问题; 4、智能体技术:利用领先的智能体框架,增强大模型的推理、对话和反思能力,解决复杂业务问题,提升用户体验; 5、大模型评测:制定和实施大模型的评估方案,结合人工评估和自动化评估手段,确保模型性能的可靠性和稳定性; 6、应用落地:定义业务问题,设定任务标准和目标,不断优化模型和系统,以达到最佳的业务效果和用户满意度。

更新于 2025-02-07
logo of bytedance
实习A59934

ByteIntern:面向2026届毕业生(2025年9月-2026年8月期间毕业),为符合岗位要求的同学提供转正机会。 团队介绍:Data-电商-智能对话团队,负责抖音电商场景下的智能对话与问答技术的创新和研究工作,致力于打造客服领域内领先的智能对话机器人,帮助平台和商家高效、准确地解决用户问题提升用户体验,降低平台/商家运维成本,不断提升业务效果。 1、数据挖掘:负责数据集的构建与维护,利用数据飞轮机制不断优化数据质量和丰富度,进行深度的数据挖掘,沉淀高价值信息,开发和优化Query理解、召回、相关性排序等技术,提升信息检索的效率和准确性,提升RAG的效果; 2、大模型训练:针对业务需求进行大模型的继续训练(CT)、有监督微调(SFT)、偏好学习,以及多模态模型训练,提升模型在特定场景下的表现; 3、提示词工程:与业务专家合作,构建和优化结构化的提示词,充分挖掘和利用大模型的能力,高效、精准解决实际问题; 4、智能体技术:利用领先的智能体框架,增强大模型的推理、对话和反思能力,解决复杂业务问题,提升用户体验; 5、大模型评测:制定和实施大模型的评估方案,结合人工评估和自动化评估手段,确保模型性能的可靠性和稳定性; 6、应用落地:定义业务问题,设定任务标准和目标,不断优化模型和系统,以达到最佳的业务效果和用户满意度。

更新于 2025-02-07
logo of bytedance
实习A200461

ByteIntern:面向2026届毕业生(2025年9月-2026年8月期间毕业),为符合岗位要求的同学提供转正机会。 团队介绍:Data-电商-智能对话团队,负责抖音电商场景下的智能对话与问答技术的创新和研究工作,致力于打造客服领域内领先的智能对话机器人,帮助平台和商家高效、准确地解决用户问题提升用户体验,降低平台/商家运维成本,不断提升业务效果。 1、数据挖掘:负责数据集的构建与维护,利用数据飞轮机制不断优化数据质量和丰富度,进行深度的数据挖掘,沉淀高价值信息,开发和优化Query理解、召回、相关性排序等技术,提升信息检索的效率和准确性,提升RAG的效果; 2、大模型训练:针对业务需求进行大模型的继续训练(CT)、有监督微调(SFT)、偏好学习,以及多模态模型训练,提升模型在特定场景下的表现; 3、提示词工程:与业务专家合作,构建和优化结构化的提示词,充分挖掘和利用大模型的能力,高效、精准解决实际问题; 4、智能体技术:利用领先的智能体框架,增强大模型的推理、对话和反思能力,解决复杂业务问题,提升用户体验; 5、大模型评测:制定和实施大模型的评估方案,结合人工评估和自动化评估手段,确保模型性能的可靠性和稳定性; 6、应用落地:定义业务问题,设定任务标准和目标,不断优化模型和系统,以达到最佳的业务效果和用户满意度。

更新于 2025-02-07
logo of bytedance
实习A194753

团队介绍:Data-抖音团队,负责抖音APP的推荐算法、内容算法、对话算法及大数据工作,对接各场景业务(短视频,直播,图文,电商,社交,生态,投稿,消息,同城,生活服务,音乐,评论,内容理解&安全、智能对话等)。我们的工作涉及大规模推荐算法的优化、复杂约束的优化问题的解决、内容理解、LLM应用以及新业务方向探索、CV/NLP等多个学术领域的算法改进工作、对多种场景的推荐架构的设计和实现和对产品数据的复杂深入的分析工作。在这里,你可以深入钻研机器学习算法的改进和优化,探索工业界最领先的推荐系统架构和推荐大模型算法、可以通过使用最新的大模型等技术支持抖音的数字人、智能客服、AI工具等创新探索;可以通过对产品的深度理解和思考,将算法应用到业务中去;也可以通过对产品和内容生态的深度分析,影响产品未来的发展方向。 课题介绍: 自然语言领域LLM的出现,效果在众多垂直任务上都好于sota模型,从推荐领域看过去工业级推荐系统在较长的时间没有大幅的变化过。本项目旨在探索推荐领域下的大模型方案,改变现在持续了较长时间的推荐模型结构和Infra的基本范式,且效果大幅好于现在的模型,在抖音短视频/直播等多个业务场景上得到应用。但是怎么做好推荐领域的大模型也是一个比较有挑战的事情,推荐对工程效率的要求更高,且用户的推荐体验上是个性化的,以及如何短视频、直播等体裁上做号内容的表征也是需要被解决的问题,这里会从模型参数scaling up、内容和用户的表征学习、内容理解多模态、超长序列建模、生成式推荐模型等多个方向来做深入的研究,对推荐场景的模型做系统性的升级。 研究方向: 跨模态的对齐和统一表征学习(推荐、内容多模态、自然语言); 推荐模型参数和算力scaling up; 超长序列建模; 生成式推荐模型。

更新于 2025-03-05