美团大模型数据生产实习生-math&code
任职要求
1. 25届及以后毕业的本硕博在读同学,计算机类/数学类专业,有扎实的学科理论基础,有相关专业竞赛经历 2. 英语读写流利,cet六级及以上 3. 具有良好的逻辑思维和分析能力,能够…
工作职责
1. 根据业务需求,生产竞赛级难度的数学/代码训练数据,提升模型推理能力 2. 参与数据合成实验,通过PE、模型微调等手段实现大批量、高质量的数据自动化生成 3. 通过模型效果评估、行业调研、论文解读等方式迭代数据生产方案,协助mentor管理内外部标注资源
日常实习:面向全体在校生,为符合岗位要求的同学提供为期3个月及以上的项目实践机会。 团队介绍:字节跳动 Seed 团队成立于 2023 年,致力于寻找通用智能的新方法,追求智能上限。团队研究方向涵盖 LLM、GenMedia、AI for Science、机器人等,在中国、新加坡、美国等地设有实验室和岗位。 Seed 团队在 AI 领域拥有长期愿景与决心,坚持深耕基础,期望成为世界一流的 AI 研究团队,为科技和社会发展作出贡献。目前团队已推出业界领先的通用大模型以及前沿的多模态能力,支持豆包、扣子、即梦等超过 50 个应用场景。 1、负责大模型数据生产领域的运营分析工作,围绕供给、质量、效率等核心环节开展监控与诊断; 2、搭建并维护业务指标体系,输出日报、周报及专题分析报告,为资源策略制定和业务决策提供支持; 3、结合业务目标,分析专家资源配置、需求匹配效率、交付质量管控、流程转化效果等问题,推动策略优化; 4、参与大模型数据生产流程的设计与优化,提升整体运营效率; 5、协助搭建Agent或自动化工具,应用于数据生产、质检、分析提效等场景。
1.行业信息调研:通过行业调研、信息收集、论文解读等方式为数据生产方案提供更多认知输入; 2.标注方案制定及执行:根据标注需求和规则,完成Agentic模型训练和效果评估数据的标注方案设计和数据生产; 3.项目管理:协助mentor监控和管理数据生产项目进展,保障数据交付质量; 4.人员管理:协助mentor完成内/外部标注人员管理,包括但不限于人员信息管理、培训成长等。
日常实习:面向全体在校生,为符合岗位要求的同学提供为期3个月及以上的项目实践机会。 团队介绍:抖音集团内容质量与数据服务平台(DOUYIN GROUP CONTENT QUALITY AND DATA SERVICE,简称CQC)是负责抖音集团今日头条、抖音、西瓜等产品内容安全与质量工作的团队,在各产品运营增长方面开展支持工作,为产品线提供数据服务的基础支持。平台下设内容质量中心、数据中心及运营支持中心,在全国10余个城市有业务分布。 1、联网模型迭代闭环:推动从数据定义到模型效果评估的执行,包括但不限于SFT、RM数据标注和生产、模型输出效果评测等; 2、联网模型产品运营:与算法团队、产品团队等密切协作,深度理解AI探索项目的特点,协助设计数据生产方案,提供策略优化建议; 3、联网模型数据运营:基于主流模型训练方法进行模型效果调优,通过Workflow、Agent自动化等手段为模型训练提供高精准数据,以提升模型表现。
ByteIntern:面向2026届毕业生(2025年9月-2026年8月期间毕业),为符合岗位要求的同学提供转正机会。 团队介绍:抖音集团内容质量与数据服务平台(DOUYIN GROUP CONTENT QUALITY AND DATA SERVICE,简称CQC)是负责抖音集团今日头条、抖音、西瓜等产品内容安全与质量工作的团队,在各产品运营增长方面开展支持工作,为产品线提供数据服务的基础支持。平台下设内容质量中心、数据中心及运营支持中心,在全国10余个城市有业务分布。 1、与产品、算法团队协作,根据模型迭代方向提供高质量数据; 2、负责大模型数据生产全流程,负责数据集标准设计、自动化链路搭建、数据集评估和质量把控,对最终数据交付负责; 3、通过LLM应用、工具和链路迭代,提升数据生产的效率,并持续跟踪大模型技术进展,持续探索智能高效的数据生产模式。