美团大模型数据运营实习生-Agent方向
任职要求
1. 27届及以后毕业的本硕博在读同学,心理学、语言学、计算机相关等专业,有扎实的学科理论基础; 2. 英语读写流利,CET六级及以上; 3. 具有良好的逻辑思维和分析能力,能够准确理解数据任务的目的和要求,并能够高效地执行复杂的数据分析任务; 4. 对大模型行业,尤其是对…
工作职责
1.行业信息调研:通过行业调研、信息收集、论文解读等方式为数据生产方案提供更多认知输入; 2.标注方案制定及执行:根据标注需求和规则,完成Agentic模型训练和效果评估数据的标注方案设计和数据生产; 3.项目管理:协助mentor监控和管理数据生产项目进展,保障数据交付质量; 4.人员管理:协助mentor完成内/外部标注人员管理,包括但不限于人员信息管理、培训成长等。
日常实习:面向全体在校生,为符合岗位要求的同学提供为期3个月及以上的项目实践机会。 团队介绍:抖音集团内容质量与数据服务平台(DOUYIN GROUP CONTENT QUALITY AND DATA SERVICE,简称CQC)是负责抖音集团今日头条、抖音、西瓜等产品内容安全与质量工作的团队,在各产品运营增长方面开展支持工作,为产品线提供数据服务的基础支持。平台下设内容质量中心、数据中心及运营支持中心,在全国10余个城市有业务分布。 1、深入理解AI大模型,产出在Agent/多模态等方向的高质量数据; 2、能通过代码和Prompt Engineering,完成数据挖掘、预处理、数据分析、链路搭建等任务; 3、与产品研发团队进行沟通协作,参与业务场景定义、数据标准制定、标注策略迭代、数据生产自动化等; 4、针对大模型的突出问题,与产品、算法、标注、评估等团队合作进行专项攻坚。
日常实习:面向全体在校生,为符合岗位要求的同学提供为期3个月及以上的项目实践机会。 团队介绍:大模型数据服务中心,是抖音集团旗下为大模型业务提供数据、评估、运营等专业解决方案的团队; 主要承接大模型数据生产、大模型评估及运营相关的业务,与研发、产品等团队紧密合作,在预训练、数据监督微调、模型强化学习、模型能力评估、产品运营等大模型全链路数据环节,共同推动模型能力持续提升与应用。 1、主导核心方向数据生产全流程管控,对数据质量与交付效率负总责,紧密联动模型迭代环节,确保数据供给与模型效果优化同频共振; 2、结合视觉理解模型的核心能力场景,制定科学规范的数据生产标准与流程,并持续迭代优化;主动设计并落地数据生产效率提升、模型效果优化相关实验,输出客观严谨的结论并反哺流程升级; 3、探索并落地多元化标注提效方案,包括但不限于标注工具优化、提示工程(PE)撰写、Agent自动化标注搭建、标注模式创新等,提升数据生产效能; 4、深度协同算法、产品团队,精准理解模型原理与算法逻辑,针对性输出数据构造、生产策略等专业建议,助力打通“数据-模型-效果”的闭环链路; 5、承担团队知识输出与带教职责,协助非技术向成员提升大语言模型相关认知与实际应用技能,赋能团队整体业务目标达成。
日常实习:面向全体在校生,为符合岗位要求的同学提供为期3个月及以上的项目实践机会。 团队介绍:抖音集团内容质量与数据服务平台(DOUYIN GROUP CONTENT QUALITY AND DATA SERVICE,简称CQC)是负责抖音集团今日头条、抖音、西瓜等产品内容安全与质量工作的团队,在各产品运营增长方面开展支持工作,为产品线提供数据服务的基础支持。平台下设内容质量中心、数据中心及运营支持中心,在全国10余个城市有业务分布。 1、深入理解AI大模型,产出在Agent/多模态等方向的高质量数据; 2、能通过代码和Prompt Engineering,完成数据挖掘、预处理、数据分析、链路搭建等任务; 3、与产品研发团队进行沟通协作,参与业务场景定义、数据标准制定、标注策略迭代、数据生产自动化等; 4、针对大模型的突出问题,与产品、算法、标注、评估等团队合作进行专项攻坚。
日常实习:面向全体在校生,为符合岗位要求的同学提供为期3个月及以上的项目实践机会。 团队介绍:CQC(中国内容质量与数据服务平台)归属于抖音集团,负责今日头条、抖音、西瓜等产品内容和抖音集团商业内容的安全质量与体验,支持各产品的运营和增长,以及为产品线提供AI算法算力的基础支持服务。 1、参与大语言模型在垂直领域的数据生产与优化,负责通用主题问题的理解与逻辑拆解,明确任务目标与关键信息,针对模型生成的初始回答,识别逻辑漏洞或语言不通顺之处,通过自动化手段进行高质量改写,确保标注数据的准确性与实验有效性; 2、从用户视角理解并处理复杂开放式问题,具备良好的问题拆解与关键词提取能力,逻辑清晰地补全思考链路,能够自然流畅地组织信息,进行事实、推理、观点的区分与表达,擅长识别模型输出中的逻辑不一致与语义偏差; 3、跨团队协作,与算法、产品等团队紧密配合,深入理解垂类方向用户需求及模型特性,不断迭代标注标准,提升数据质量与准确性; 4、关注行业动态与先进实践,持续关注大语言模型的发展趋势,探索数据生产在模型能力提升中的作用,学习并应用行业先进的数据生产方法于数据生产工作中。