夸克智能信息-大模型PE策略运营专家-北京/杭州
任职要求
1.本科及以上学历,计算机、软件工程、人工智能等专业优先 2.具备PE能力,能够独立设计prompt策略形成工作流程,提高数据生产的质量和效率 3.能够使用python/Java等语言,关注前沿科技,熟悉llm相关知识,拥有大模型和ai相关从业经验优先 4.具有较强的学历能力和沟通学著能力,综合运营能力强,能主动推动解决问题
工作职责
1.深入理解实际业务场景,和各业务线充分沟通实际需求,搭建自动标注体系,编写PE和workflow程序,实现标注数据的规模生成和筛选。 2.负责prompt生产过程的制定以及不断迭代优化(包含数据分析、调优prompt,重新定义场景和目标等) 3.能通过PE代码完成数据预处理、分析和清洗,探索更高效的数据生产方式 4.通过输出和带教,提升数据团队对技术和大预言模型的了解,教授应用技巧,推动业务达成目标
1、搭建具有通用性和可拓展性的NLP标注框架,与算法团队对齐标准、撰写相关培训方案,根据模型迭代方向提供高质量数据; 2、负责大语言模型训练过程中各阶段数据生产,对自动化链路搭建、数据质量评估及外部资源管理负责,确保大语言模型训练数据有效; 3、能通过PE、代码完成数据预处理、分析和清洗,按照训练需求进行标注、分析和验证调优,提升模型效果; 4、与产品算法团队协同,积极探索自动化数据生产、数据合成等方法,提高数据标注效率,持续跟踪大模型技术进展,持续探索智能高效的数据生产模式。
1、搭建具有通用性和可拓展性的TTS标注框架,与算法团队对齐标准、撰写相关培训方案,根据模型迭代方向提供高质量数据; 2、负责大语言模型训练过程中各阶段数据生产,对自动化链路搭建、数据质量评估及外部资源管理负责,确保大语言模型训练数据有效; 3、能通过PE、代码完成数据预处理、分析和清洗,按照训练需求进行标注、分析和验证调优,提升模型效果; 4、与产品算法团队协同,积极探索自动化数据生产、数据合成等方法,提高数据标注效率,持续跟踪大模型技术进展,持续探索智能高效的数据生产模式。
1、构建并完善语言模型的评估标准与体系,全面负责大模型在语言能力方面的评测工作,确保评估的准确性与科学性; 2、协调各方资源,与研发、测试、产品等团队紧密合作,高效推进大模型评测项目,保障项目按计划顺利进行; 3、探索创新且高效的模型评测方案,能够根据实际需求推动评测集的构建与落地; 4、深入调研行业内公开的评测方法,及时将有价值的公开评测集整合到内部评测平台,持续丰富评测资源; 5、运用PE技术,优化评测流程与评测准确率,提升模型在不同场景下的表现; 6、分析评测数据,生成详细报告,为模型优化提供有力的数据支持和建设性建议。
ByteIntern:面向2026届毕业生(2025年9月-2026年8月期间毕业),为符合岗位要求的同学提供转正机会。 团队介绍:抖音集团内容质量与数据服务平台(DOUYIN GROUP CONTENT QUALITY AND DATA SERVICE,简称CQC)是负责抖音集团今日头条、抖音、西瓜等产品内容安全与质量工作的团队,在各产品运营增长方面开展支持工作,为产品线提供数据服务的基础支持。平台下设内容质量中心、数据中心及运营支持中心,在全国10余个城市有业务分布。 1、深入理解AI大模型记忆使用场景,产出Memory、History等方向的高质量SFT/RM数据; 2、与产品研发团队紧密配合,快速沉淀大模型数据理想态和标准,积极为模型后训练提供数据策略和建议; 3、针对大模型的突出问题,与产品研发团队合作进行专项攻坚,交付高质量的数据集; 4、通过设计PE策略、Workflow等,探索更高效的数据生产方式。