字节跳动AI数据运营实习生(Memory方向)-内容质量与数据服务平台
任职要求
1、2026届硕士及以上学位在读,中文、法律、心理学、社会学、人类学、新闻传播、计算机、人工智能等相关专业优先; 2、学术素养优秀,有能力提出假设,通过量性或质性的方法检验假设,得出结论,胜任英文学术文献检索、阅读和发表优先; 3、了解大模型基础原理,熟练使用各类大模型产品,了解基本概念和LLM数据标注的流程和方法; 4、具备较强的逻辑拆解与深度分析能力,能从复杂的业务场景中定位核心问题、挖掘关键关联,擅长归纳提炼零散信息,形成可落地的策略与执行框架,推动数据方案高效落地; 5、对AI有高度热情,有较强的自驱、学习、沟通和抗压能力,有复合型学科背景优先;能实习4个月以上的优先考虑,掌握基础的Python、SQL等编程语言加分。
工作职责
ByteIntern:面向2026届毕业生(2025年9月-2026年8月期间毕业),为符合岗位要求的同学提供转正机会。 团队介绍:抖音集团内容质量与数据服务平台(DOUYIN GROUP CONTENT QUALITY AND DATA SERVICE,简称CQC)是负责抖音集团今日头条、抖音、西瓜等产品内容安全与质量工作的团队,在各产品运营增长方面开展支持工作,为产品线提供数据服务的基础支持。平台下设内容质量中心、数据中心及运营支持中心,在全国10余个城市有业务分布。 1、深入理解AI大模型记忆使用场景,产出Memory、History等方向的高质量SFT/RM数据; 2、与产品研发团队紧密配合,快速沉淀大模型数据理想态和标准,积极为模型后训练提供数据策略和建议; 3、针对大模型的突出问题,与产品研发团队合作进行专项攻坚,交付高质量的数据集; 4、通过设计PE策略、Workflow等,探索更高效的数据生产方式。
ByteIntern:面向2026届毕业生(2025年9月-2026年8月期间毕业),为符合岗位要求的同学提供转正机会。 团队介绍:抖音研发团队,主要负责抖音短视频的业务和技术研发、公司全部产品的内容安全业务。截至2020年8月,抖音日活用户超6亿,并继续保持高速增长。未来一年,抖音将更多关注对创作者和社会的价值。团队汇聚各种背景的顶尖人才,在更大体量更为复杂的业务场景中不断提升,在项目0-1的过程中影响上亿用户。期待你的加入! 1、负责抖音运营与生态团队大模型相关的业务开发,包含创作者服务(流量、培优、创作灵感等)以及对内的抖音规模化运营能力建设,快速搭建应用并在业务中落地,持续优化产品体验、稳定性; 2、与产品经理、数据分析师、算法、数据工程师等角色紧密合作,理解业务需求,制定技术方案,并推动项目的落地和优化; 3、持续探索在各种场景下,利用AI能力增强产品体验,提升工程效率。
日常实习:面向全体在校生,为符合岗位要求的同学提供为期3个月及以上的项目实践机会。 团队介绍:该团队负责字节跳动旗下部分内容安全产品的设计、质量把控和运营,保障产品安全,营造良好的内容创作和社区互动氛围。 1、负责AI数据团队的业务指标数据表和数据报告的周期性产出,在规定时间节点高质量交付数据; 2、通过定量、定性分析,对团队业务指标表现进行基础数据分析; 3、负责数据看板的数据交叉验证,记录反馈,提升看板数据质量,协助跨部门同事推动数据指标的迭代更新; 4、AI数据标注队列信息及人员信息的数据汇总、数据清洗和存量问题治理,协助部门同事改善团队内部数据生态,提升数据线上化、可视化水平; 5、完成其他项目运营相关工作。
日常实习:面向全体在校生,为符合岗位要求的同学提供为期3个月及以上的项目实践机会。 团队介绍:抖音集团内容质量与数据服务平台(DOUYIN GROUP CONTENT QUALITY AND DATA SERVICE,简称CQC)是负责抖音集团今日头条、抖音、西瓜等产品内容安全与质量工作的团队,在各产品运营增长方面开展支持工作,为产品线提供数据服务的基础支持。平台下设内容质量中心、数据中心及运营支持中心,在全国10余个城市有业务分布。 1、深入理解AI大模型,产出在Agent/多模态等方向的高质量数据; 2、能通过代码和Prompt Engineering,完成数据挖掘、预处理、数据分析、链路搭建等任务; 3、与产品研发团队进行沟通协作,参与业务场景定义、数据标准制定、标注策略迭代、数据生产自动化等; 4、针对大模型的突出问题,与产品、算法、标注、评估等团队合作进行专项攻坚。
日常实习:面向全体在校生,为符合岗位要求的同学提供为期3个月及以上的项目实践机会。 团队介绍:抖音集团内容质量与数据服务平台(DOUYIN GROUP CONTENT QUALITY AND DATA SERVICE,简称CQC)是负责抖音集团今日头条、抖音、西瓜等产品内容安全与质量工作的团队,在各产品运营增长方面开展支持工作,为产品线提供数据服务的基础支持。平台下设内容质量中心、数据中心及运营支持中心,在全国10余个城市有业务分布。 1、深入理解AI大模型,产出在多模态对话/内容创作/长文本/推理等方向的高质量数据; 2、能通过代码和Prompt Engineering,完成数据挖掘、预处理、数据分析、链路搭建等任务; 3、与产品研发团队进行沟通协作,参与日常工作、工具优化、标注标准制定等; 4、针对大模型的突出问题,与标注团队合作进行项目专项攻坚。