字节跳动大模型搜索数据交付-内容质量与数据服务平台
任职要求
1、2026届获得本科及以上学历,计算机、人工智能、统计学、数据科学等相关专业优先; 2、在校项目或实习中有大模型训练、搜索运营、效果评测等相关经验优先; 3、学习能力强、管理统筹能力强、有责任心,有AI从业经验或资深AI使用者优先。
工作职责
团队介绍:CQC(中国内容质量与数据服务平台)归属于抖音集团,负责今日头条、抖音、西瓜等产品内容和抖音集团商业内容的安全质量与体验,支持各产品的运营和增长,以及为产品线提供AI算法算力的基础支持服务。 1、联网模型迭代闭环:推动从数据定义到模型效果评估的执行,包括但不限于SFT、RM数据标注和生产、模型输出效果评测等; 2、联网模型产品运营:与算法团队、产品团队等密切协作,深度理解AI探索项目的特点,协助设计数据生产方案,提供策略优化建议; 3、联网模型数据运营:基于主流模型训练方法进行模型效果调优,通过Workflow、Agent自动化等手段为模型训练提供高精准数据,以提升模型表现。
日常实习:面向全体在校生,为符合岗位要求的同学提供为期3个月及以上的项目实践机会。 团队介绍:抖音集团内容质量与数据服务平台(DOUYIN GROUP CONTENT QUALITY AND DATA SERVICE,简称CQC)是负责抖音集团今日头条、抖音、西瓜等产品内容安全与质量工作的团队,在各产品运营增长方面开展支持工作,为产品线提供数据服务的基础支持。平台下设内容质量中心、数据中心及运营支持中心,在全国10余个城市有业务分布。 1、深度参与垂类业务的开发与优化闭环; 2、根据业务需求高效执行标注及评测任务,确保数据及报告的质量、一致性和时效性; 3、通过数据洞察发现问题,主动提出并推动流程、标准及协作的优化建议,提升作业效率、数据质量和结论价值; 4、快速理解业务逻辑和技术背景,利用大模型在内的多种工具提升工作效率; 5、与产品、研发团队紧密协作,保障数据交付与模型迭代流程顺畅,共同提升垂类的效果和用户体验。
1、支持火山方舟大模型的应用落地,将字节跳动的内容与大模型相结合,为用户提供更智能的信息服务; 2、带领团队探索行业前沿的NLP技术,将先进的深度学习模型创新性应用于用户Query分析、Query改写等业务方向,精准把握用户需求,持续提升用户理解的深度与广度; 3、利用NLP技术以及大模型技术,对内容进行分析、理解,完成内容打标、内容摘要等信息的生成和提取; 4、以外挂知识库模式为切入点,在内容搜索领域进行深度探索,组织团队运用NLP、多模态技术实现高质量内容的快速召回,显著提升搜索效率与质量; 5、主导大模型技术与Ranking技术的深度融合,解决内容排序的复杂问题; 6、管理和指导算法团队,制定团队技术发展路线,推动团队整体技术能力提升;合理分配工作任务,确保项目按时高质量交付。
1、负责百科词条内容优化的安全、质量把关,服务AI搜主Bot信息知识类需求满足能力建设; 2、对接产品、研发团队,跟进搜索场景内容优化的线索承接、清洗,审核流程与策略维护,提升有效线索的筛查效率和审核有效进审率; 3、对接审核团队,跟进各类标准的敏捷迭代维护和高效准确落地,通过培训、质检、申诉对齐、质量评估等方式提升执行准确率与人效; 4、检查和验收下游交付数据,通过日常数据监控与分析,沉淀问题发现-定性-解决的全链路方案,反推业务流程优化提效,服务审核降本增效。
负责对基于大模型构建的通用垂类应用进行效果和质量评估;通过与产品研发团队的紧密合作,制定评估标准和体系,准确分析评估效果,为应用的优化和改进提供支持,以提升应用的性能、用户体验和市场竞争力; 应用效果与质量评估: 1)负责评估基于大语言模型构建的通用垂类应用的效果和质量,包括但不限于语言理解准确性、生成内容的合理性、逻辑连贯性、知识准确性等方面; 2)参与设计测试用例,涵盖不同场景、用户需求和输入条件,以确保应用在各种情况下的稳定性和可靠性; 3)参与收集和分析用户反馈数据,结合实际使用情况,对应用的性能和用户体验进行综合评估; 评估标准与体系建设: 1)理解业务需求和产品目标,与产品研发团队密切沟通和协作,负责制定详细、明确的评估标准和指标体系; 2)理解评估数据的收集、整理和分析流程,确保评估数据的完整性和可靠性,为评估体系的持续改进提供数据支持; 评估效果分析与报告:撰写评估报告,清晰阐述评估方法、过程、结果和结论,为产品研发团队提供决策依据和改进方向。