字节跳动AI数据运营实习生-内容质量与数据服务平台
任职要求
1、本科及以上学历在读,计算机、人工智能、哲学、新闻学等相关专业学科,有复合型学科背景优先; 2、熟练使用Python、SQL等语言,了解机器学习/人工智能/模型调优,熟悉各种算法的基本概念; 3、了解提示词工程(Prompt Engineering),能优化Prompt解决不同类型的任务需求,提高模型的准确性和效率; 4、具备一定的文字内容感知能力,熟悉LLM数据标注的流程和方法优先; 5、对AI有高度热情,有较强的自驱力、抗压能力和学习能力,能实习6月以上的优先,每周4天以上。
工作职责
日常实习:面向全体在校生,为符合岗位要求的同学提供为期3个月及以上的项目实践机会。 团队介绍:抖音集团内容质量与数据服务平台(DOUYIN GROUP CONTENT QUALITY AND DATA SERVICE,简称CQC)是负责抖音集团今日头条、抖音、西瓜等产品内容安全与质量工作的团队,在各产品运营增长方面开展支持工作,为产品线提供数据服务的基础支持。平台下设内容质量中心、数据中心及运营支持中心,在全国10余个城市有业务分布。 1、深入理解AI大模型,产出在多模态对话/内容创作/长文本/推理等方向的高质量数据; 2、能通过代码和Prompt Engineering,完成数据挖掘、预处理、数据分析、链路搭建等任务; 3、与产品研发团队进行沟通协作,参与日常工作、工具优化、标注标准制定等; 4、针对大模型的突出问题,与标注团队合作进行项目专项攻坚。
日常实习:面向全体在校生,为符合岗位要求的同学提供为期3个月及以上的项目实践机会。 团队介绍:抖音集团内容质量与数据服务平台(DOUYIN GROUP CONTENT QUALITY AND DATA SERVICE,简称CQC)是负责抖音集团今日头条、抖音、西瓜等产品内容安全与质量工作的团队,在各产品运营增长方面开展支持工作,为产品线提供数据服务的基础支持。平台下设内容质量中心、数据中心及运营支持中心,在全国10余个城市有业务分布。 1、深入理解AI大模型,对大模型数据以及知识理想态有深刻认知; 2、能准确理解产品研发需求,通过PE(提示词工程)等方法,持续产出符合理想态的高质量内容; 3、负责金融知识场景中大模型数据的标注、质检与策略运营工作; 4、与产品研发协同,针对大模型的突出问题,进行知识的专项攻坚。
日常实习:面向全体在校生,为符合岗位要求的同学提供为期3个月及以上的项目实践机会。 团队介绍:抖音集团内容质量与数据服务平台(DOUYIN GROUP CONTENT QUALITY AND DATA SERVICE,简称CQC)是负责抖音集团今日头条、抖音、西瓜等产品内容安全与质量工作的团队,在各产品运营增长方面开展支持工作,为产品线提供数据服务的基础支持。平台下设内容质量中心、数据中心及运营支持中心,在全国10余个城市有业务分布。 1、深入理解AI大模型,产出在Agent/多模态等方向的高质量数据; 2、能通过代码和Prompt Engineering,完成数据挖掘、预处理、数据分析、链路搭建等任务; 3、与产品研发团队进行沟通协作,参与业务场景定义、数据标准制定、标注策略迭代、数据生产自动化等; 4、针对大模型的突出问题,与产品、算法、标注、评估等团队合作进行专项攻坚。
ByteIntern:面向2026届毕业生(2025年9月-2026年8月期间毕业),为符合岗位要求的同学提供转正机会。 团队介绍:抖音集团内容质量与数据服务平台(DOUYIN GROUP CONTENT QUALITY AND DATA SERVICE,简称CQC)是负责抖音集团今日头条、抖音、西瓜等产品内容安全与质量工作的团队,在各产品运营增长方面开展支持工作,为产品线提供数据服务的基础支持。平台下设内容质量中心、数据中心及运营支持中心,在全国10余个城市有业务分布。 1、深入理解AI大模型,了解娱乐AI场景玩法,通过数据挖掘、数据合成、人工构造等方式生产游戏/剧本/故事体验等高质量数据集,对数据生成质量和效率负责; 2、与算法产品团队密切协作,积极提供有针对性的数据合成策略和建议,共同闭环验证数据在模型实验上的有效性,提升数据可用性与价值; 3、通过PE、代码完成数据预处理、分析和清洗,探索更高效的数据生产方式; 4、通过输出和带教,提升数据团队对技术和大语言模型的了解,教授应用技巧,推动团队达成业务目标。
ByteIntern:面向2026届毕业生(2025年9月-2026年8月期间毕业),为符合岗位要求的同学提供转正机会。 团队介绍:抖音集团内容质量与数据服务平台(DOUYIN GROUP CONTENT QUALITY AND DATA SERVICE,简称CQC)是负责抖音集团今日头条、抖音、西瓜等产品内容安全与质量工作的团队,在各产品运营增长方面开展支持工作,为产品线提供数据服务的基础支持。平台下设内容质量中心、数据中心及运营支持中心,在全国10余个城市有业务分布。 1、深入理解AI大模型记忆使用场景,产出Memory、History等方向的高质量SFT/RM数据; 2、与产品研发团队紧密配合,快速沉淀大模型数据理想态和标准,积极为模型后训练提供数据策略和建议; 3、针对大模型的突出问题,与产品研发团队合作进行专项攻坚,交付高质量的数据集; 4、通过设计PE策略、Workflow等,探索更高效的数据生产方式。