字节跳动文本大模型数据探索运营实习生-内容质量与数据服务平台
任职要求
1、2026届本科及以上学历在读,计算机、数学、数据科学、哲学、逻辑学等专业优先; 2、计算机、数学背景同学技能基础,精通至少一门编程语言(Python/C++/Java等),数据结构与算法基础扎实,代码规范良好,熟练使用至少一种深度学习框架(PyTorch/TensorFlow等),熟悉模型训练、调参与基础部署流程,熟悉主流开源大模型与生态(如DeepSeek/Qwen/LLama等),具备Prompt设计、RAG搭建与微调相关经验,在以下至少一个方向具备深入研究与落地经验:中文分词、文本分类、语义表示、语义匹配、主题模型、篇章/组块分析、信息抽取、对话管理、知识图谱构建与应用等; 3、AI应用经验,熟练使用主流大语言模型产品,具备一定AI理解力,有Agent、模型训练实践经验者优先; 4、探索与创新能力,对新技术与AI应用场景有浓厚兴趣和主观能动性,具备科研背景或强探索精神者优先; 5、通用素质,具有较强的自驱力、抗压能力与学习能力(包括论文理解与研究能力),具备清晰的表达与独立判断能力,沟通协调能力与团队合作意识优秀。
工作职责
ByteIntern:面向2026届毕业生(2025年9月-2026年8月期间毕业),为符合岗位要求的同学提供转正机会。 团队介绍:CQC(中国内容质量与数据服务平台)归属于抖音集团,负责今日头条、抖音、西瓜等产品内容和抖音集团商业内容的安全质量与体验,支持各产品的运营和增长,以及为产品线提供AI算法算力的基础支持服务。 1、参与大语言模型在垂直领域的数据生产与优化,负责通用主题问题的理解与逻辑拆解,明确任务目标与关键信息,针对模型生成的初始回答,识别逻辑漏洞或语言不通顺之处,通过自动化手段进行高质量改写,确保标注数据的准确性与实验有效性; 2、从用户视角理解并处理复杂开放式问题,具备良好的问题拆解与关键词提取能力,逻辑清晰地补全思考链路,能够自然流畅地组织信息,进行事实、推理、观点的区分与表达,擅长识别模型输出中的逻辑不一致与语义偏差; 3、跨团队协作,与算法、产品等团队紧密配合,深入理解垂类方向用户需求及模型特性,不断迭代标注标准,提升数据质量与准确性; 4、关注行业动态与先进实践,持续关注大语言模型的发展趋势,探索数据生产在模型能力提升中的作用,学习并应用行业先进的数据生产方法于数据生产工作中。
日常实习:面向全体在校生,为符合岗位要求的同学提供为期3个月及以上的项目实践机会。 团队介绍:CQC(中国内容质量与数据服务平台)归属于抖音集团,负责今日头条、抖音、西瓜等产品内容和抖音集团商业内容的安全质量与体验,支持各产品的运营和增长,以及为产品线提供AI算法算力的基础支持服务。 1、参与大语言模型在垂直领域的数据生产与优化,负责通用主题问题的理解与逻辑拆解,明确任务目标与关键信息,针对模型生成的初始回答,识别逻辑漏洞或语言不通顺之处,通过自动化手段进行高质量改写,确保标注数据的准确性与实验有效性; 2、从用户视角理解并处理复杂开放式问题,具备良好的问题拆解与关键词提取能力,逻辑清晰地补全思考链路,能够自然流畅地组织信息,进行事实、推理、观点的区分与表达,擅长识别模型输出中的逻辑不一致与语义偏差; 3、跨团队协作,与算法、产品等团队紧密配合,深入理解垂类方向用户需求及模型特性,不断迭代标注标准,提升数据质量与准确性; 4、关注行业动态与先进实践,持续关注大语言模型的发展趋势,探索数据生产在模型能力提升中的作用,学习并应用行业先进的数据生产方法于数据生产工作中。
日常实习:面向全体在校生,为符合岗位要求的同学提供为期3个月及以上的项目实践机会。 团队介绍:抖音集团内容质量与数据服务平台(DOUYIN GROUP CONTENT QUALITY AND DATA SERVICE,简称CQC)是负责抖音集团今日头条、抖音、西瓜等产品内容安全与质量工作的团队,在各产品运营增长方面开展支持工作,为产品线提供数据服务的基础支持。平台下设内容质量中心、数据中心及运营支持中心,在全国10余个城市有业务分布。 1、负责提升大模型“智商”,全链路(包含Pretrain、SFT、RLHF等)提升大模型的模型效果; 2、持续跟踪业界前沿研究进展,和团队一起建立深入广泛的领域技术认知,推动研究成果实际落地,产生广泛影响力; 3、深度参与到探索项目,探索大模型数据生产方法和数据形式,实现大模型能力的突破。
日常实习:面向全体在校生,为符合岗位要求的同学提供为期3个月及以上的项目实践机会。 团队介绍:抖音集团内容质量与数据服务平台(DOUYIN GROUP CONTENT QUALITY AND DATA SERVICE,简称CQC)是负责抖音集团今日头条、抖音、西瓜等产品内容安全与质量工作的团队,在各产品运营增长方面开展支持工作,为产品线提供数据服务的基础支持。平台下设内容质量中心、数据中心及运营支持中心,在全国10余个城市有业务分布。 1、负责提升大模型“智商”,全链路(包含Pretrain、SFT、RLHF等)提升大模型的模型效果; 2、持续跟踪业界前沿研究进展,和团队一起建立深入广泛的领域技术认知,推动研究成果实际落地,产生广泛影响力; 3、深度参与到探索项目,探索大模型数据生产方法和数据形式,实现大模型能力的突破。
日常实习:面向全体在校生,为符合岗位要求的同学提供为期3个月及以上的项目实践机会。 团队介绍:团队介绍:TikTok是一个覆盖150个国家和地区的国际短视频平台,我们希望通过TikTok发现真实、有趣的瞬间,让生活更美好。TikTok 在全球各地设有办公室,全球总部位于洛杉矶和新加坡,办公地点还包括纽约、伦敦、都柏林、巴黎、柏林、迪拜、雅加达、首尔和东京等多个城市。 TikTok LIVE 作为一种新的内容形式,为生态各方创造价值。直播为用户提供独特的内容和消费体验;直播为创作者找到合适的观众,提供最好的工具和一系列盈利模式;通过直播,平台也能从中获得健康、客观的分成收益,直播也是 TikTok 三个主要收入来源之一。 创作者和平台有一种美妙的共生关系,我们帮助创作者创造生计、改变他们的生活;作为平台,我们也可以从中获益、持续发展。我们一直听到这样的故事 —— “LIVE changes my life”。他们更好,我们才会更好。 加入我们,一起探索 “不可能的事”—— 我们是行业的先行者,在一步步改变行业。我们持续让行业了解直播是一种新的内容形式,是创作者可以依赖的商业模式。在几年前,没有人能想象直播会发展成今天的状态。现在,每月都有几百个合作伙伴加入,和我们一起助力创作者。在可见的一年中,我们还会看到电商为直播带来的新变化和发展。 1、负责文本生成模型训练相关的数据收集、标注和整理; 2、负责大模型生成内容的效果评估,改进生成内容质量; 3、收集LLM用户反馈,帮助垂类业务LLM产品落地。