字节跳动数据运营实习生-内容质量与数据服务平台
任职要求
1、本科及以上学历在读,金融、法律、医疗、文学、理工、泛文科、科技、教育等专业优先; 2、关注前沿科技,熟悉LLM相关知识,热爱大模型行业,拥有LLM和AI行业等相关从业经验优先; 3、具备较强的学习力和沟通协作能力,综合运营能力强,能主动推动问题解决; 4、每周出勤要求至少4天及以上,实习期至少三个月及以上。
工作职责
日常实习:面向全体在校生,为符合岗位要求的同学提供为期3个月及以上的项目实践机会。 团队介绍:抖音集团内容质量与数据服务平台(DOUYIN GROUP CONTENT QUALITY AND DATA SERVICE,简称CQC)是负责抖音集团今日头条、抖音、西瓜等产品内容安全与质量工作的团队,在各产品运营增长方面开展支持工作,为产品线提供数据服务的基础支持。平台下设内容质量中心、数据中心及运营支持中心,在全国10余个城市有业务分布。 1、负责规模化运营外包专家团队,制定和优化人工评估流程和标准,对专家评估结果进行质量把控,进行数据分析,撰写评估报告,为模型优化提供可靠依据; 2、搭建自动评估和标注体系,编写PE和Workflow程序,实现评估数据的规模生成与筛选,协同产品研发团队完成自动评估系统搭建与优化; 3、制作自动评估的评测集,从多样性、时效性、真实性、区分度等维度,保障评测集的质量,辅助研发快速迭代。
日常实习:面向全体在校生,为符合岗位要求的同学提供为期3个月及以上的项目实践机会。 团队介绍:抖音集团内容质量与数据服务平台(DOUYIN GROUP CONTENT QUALITY AND DATA SERVICE,简称CQC)是负责抖音集团今日头条、抖音、西瓜等产品内容安全与质量工作的团队,在各产品运营增长方面开展支持工作,为产品线提供数据服务的基础支持。平台下设内容质量中心、数据中心及运营支持中心,在全国10余个城市有业务分布。 1、深入理解AI大模型,产出在多模态对话/内容创作/长文本/推理等方向的高质量数据; 2、能通过代码和Prompt Engineering,完成数据挖掘、预处理、数据分析、链路搭建等任务; 3、与产品研发团队进行沟通协作,参与日常工作、工具优化、标注标准制定等; 4、针对大模型的突出问题,与标注团队合作进行项目专项攻坚。
日常实习:面向全体在校生,为符合岗位要求的同学提供为期3个月及以上的项目实践机会。 团队介绍:抖音集团内容质量与数据服务平台(DOUYIN GROUP CONTENT QUALITY AND DATA SERVICE,简称CQC)是负责抖音集团今日头条、抖音、西瓜等产品内容安全与质量工作的团队,在各产品运营增长方面开展支持工作,为产品线提供数据服务的基础支持。平台下设内容质量中心、数据中心及运营支持中心,在全国10余个城市有业务分布。 1、深入理解AI大模型,对大模型数据以及知识理想态有深刻认知; 2、能准确理解产品研发需求,通过PE(提示词工程)等方法,持续产出符合理想态的高质量内容; 3、负责金融知识场景中大模型数据的标注、质检与策略运营工作; 4、与产品研发协同,针对大模型的突出问题,进行知识的专项攻坚。
日常实习:面向全体在校生,为符合岗位要求的同学提供为期3个月及以上的项目实践机会。 团队介绍:抖音集团内容质量与数据服务平台(DOUYIN GROUP CONTENT QUALITY AND DATA SERVICE,简称CQC)是负责抖音集团今日头条、抖音、西瓜等产品内容安全与质量工作的团队,在各产品运营增长方面开展支持工作,为产品线提供数据服务的基础支持。平台下设内容质量中心、数据中心及运营支持中心,在全国10余个城市有业务分布。 1、联网模型迭代闭环:推动从数据定义到模型效果评估的执行,包括但不限于SFT、RM数据标注和生产、模型输出效果评测等; 2、联网模型产品运营:与算法团队、产品团队等密切协作,深度理解AI探索项目的特点,协助设计数据生产方案,提供策略优化建议; 3、联网模型数据运营:基于主流模型训练方法进行模型效果调优,通过Workflow、Agent自动化等手段为模型训练提供高精准数据,以提升模型表现。
日常实习:面向全体在校生,为符合岗位要求的同学提供为期3个月及以上的项目实践机会。 团队介绍:CQC(中国内容质量与数据服务平台)归属于抖音集团,负责今日头条、抖音、西瓜等产品内容和抖音集团商业内容的安全质量与体验,支持各产品的运营和增长,以及为产品线提供AI算法算力的基础支持服务。 1、参与大语言模型在垂直领域的数据生产与优化,负责通用主题问题的理解与逻辑拆解,明确任务目标与关键信息,针对模型生成的初始回答,识别逻辑漏洞或语言不通顺之处,通过自动化手段进行高质量改写,确保标注数据的准确性与实验有效性; 2、从用户视角理解并处理复杂开放式问题,具备良好的问题拆解与关键词提取能力,逻辑清晰地补全思考链路,能够自然流畅地组织信息,进行事实、推理、观点的区分与表达,擅长识别模型输出中的逻辑不一致与语义偏差; 3、跨团队协作,与算法、产品等团队紧密配合,深入理解垂类方向用户需求及模型特性,不断迭代标注标准,提升数据质量与准确性; 4、关注行业动态与先进实践,持续关注大语言模型的发展趋势,探索数据生产在模型能力提升中的作用,学习并应用行业先进的数据生产方法于数据生产工作中。