美团大模型数据运营-推理方向(实习生)
任职要求
1. 学历背景:25届及以后毕业的本科/硕士/博士在读同学;计算机、数学、物化生等相关专业,有扎实的学科理论基础; 2. 语言能力:读写流利,英语cet六级及以上 3. 逻辑思维:具有良好的逻辑思维和分析能力,能够准确理解数据任务的目的和要求,并能够高效地执行复杂的数据分析任务; 4. 沟通与协作:具备良好的沟通能力和团队协作精神,能够与团队成员有效沟通,协同解决问题,共同推进项目进度。
工作职责
1. 数据标注执行:人工对大模型训练所需的推理数据进行判断、排序或改写;通过prompt engineering合成大批量高质数据,确保数据的准确性和一致性; 2. 标注方案制定:分析模型效果、调研论文或收集行业数据,沉淀相关结果文档,支持数据方案迭代/优化; 3. 标注项目管理:协助负责人管理内/外部标注人力,完成包括但不限于培训、质检、答疑等工作; 4. 团队协作:与技术团队紧密合作,及时反馈问题,根据模型效果及时调整标注策略。 5. 模型实验(代码方向):参与数据自动合成实验,负责模型微调并落地各种训练实验
1. 深入理解多模态大模型,调研多语种语音音系特征、完善标注规范、验收数据质量,为业务和算法提供知识技能支持; 2. 负责大模型语音数据的质量监控或验收等工作,并定期对语音技术效果做出评价与反馈; 3. 协助mentor管理一或多个语种的数据生产项目,协助产品和算法优化模型效果。
ByteIntern:面向2026届毕业生(2025年9月-2026年8月期间毕业),为符合岗位要求的同学提供转正机会。 团队介绍:CQC(中国内容质量与数据服务平台)归属于抖音集团,负责今日头条、抖音、西瓜等产品内容和抖音集团商业内容的安全质量与体验,支持各产品的运营和增长,以及为产品线提供AI算法算力的基础支持服务。 1、参与大语言模型在垂直领域的数据生产与优化,负责通用主题问题的理解与逻辑拆解,明确任务目标与关键信息,针对模型生成的初始回答,识别逻辑漏洞或语言不通顺之处,通过自动化手段进行高质量改写,确保标注数据的准确性与实验有效性; 2、从用户视角理解并处理复杂开放式问题,具备良好的问题拆解与关键词提取能力,逻辑清晰地补全思考链路,能够自然流畅地组织信息,进行事实、推理、观点的区分与表达,擅长识别模型输出中的逻辑不一致与语义偏差; 3、跨团队协作,与算法、产品等团队紧密配合,深入理解垂类方向用户需求及模型特性,不断迭代标注标准,提升数据质量与准确性; 4、关注行业动态与先进实践,持续关注大语言模型的发展趋势,探索数据生产在模型能力提升中的作用,学习并应用行业先进的数据生产方法于数据生产工作中。
日常实习:面向全体在校生,为符合岗位要求的同学提供为期3个月及以上的项目实践机会。 团队介绍:CQC(中国内容质量与数据服务平台)归属于抖音集团,负责今日头条、抖音、西瓜等产品内容和抖音集团商业内容的安全质量与体验,支持各产品的运营和增长,以及为产品线提供AI算法算力的基础支持服务。 1、参与大语言模型在垂直领域的数据生产与优化,负责通用主题问题的理解与逻辑拆解,明确任务目标与关键信息,针对模型生成的初始回答,识别逻辑漏洞或语言不通顺之处,通过自动化手段进行高质量改写,确保标注数据的准确性与实验有效性; 2、从用户视角理解并处理复杂开放式问题,具备良好的问题拆解与关键词提取能力,逻辑清晰地补全思考链路,能够自然流畅地组织信息,进行事实、推理、观点的区分与表达,擅长识别模型输出中的逻辑不一致与语义偏差; 3、跨团队协作,与算法、产品等团队紧密配合,深入理解垂类方向用户需求及模型特性,不断迭代标注标准,提升数据质量与准确性; 4、关注行业动态与先进实践,持续关注大语言模型的发展趋势,探索数据生产在模型能力提升中的作用,学习并应用行业先进的数据生产方法于数据生产工作中。
日常实习:面向全体在校生,为符合岗位要求的同学提供为期3个月及以上的项目实践机会。 团队介绍:抖音集团内容质量与数据服务平台(DOUYIN GROUP CONTENT QUALITY AND DATA SERVICE,简称CQC)是负责抖音集团今日头条、抖音、西瓜等产品内容安全与质量工作的团队,在各产品运营增长方面开展支持工作,为产品线提供数据服务的基础支持。平台下设内容质量中心、数据中心及运营支持中心,在全国10余个城市有业务分布。 1、深入理解AI大模型,产出在多模态对话/内容创作/长文本/推理等方向的高质量数据; 2、能通过代码和Prompt Engineering,完成数据挖掘、预处理、数据分析、链路搭建等任务; 3、与产品研发团队进行沟通协作,参与日常工作、工具优化、标注标准制定等; 4、针对大模型的突出问题,与标注团队合作进行项目专项攻坚。