logo of bytedance

字节跳动大模型数据生产/分析(通用方向)实习生-AI数据与安全

实习兼职A161913A地点:北京状态:招聘

任职要求


1、本科及以上学历在读,专业不限,理科、社会科学、建筑学、法学、经济学或具备文理交叉背景的同学优先;
2、有大模型数据相关实习经历,了解大模型训练和评估的基本链路,对数据生产、标注、评估等环节有实践经验者优先;
3、具备出色的项目管理…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


日常实习:面向全体在校生,为符合岗位要求的同学提供为期3个月及以上的项目实践机会。
团队介绍:AI数据与安全团队为Seed基座模型及AI原生应用提供跨模态数据服务,覆盖数据生产全流程,包含模型评估标准的制定、数据规模化生产、数据飞轮搭建,不断提升数据质量,支持模型快速迭代。
团队由产品经理、数据工程、数据运营等跨职能人才组成,并通过与Seed研究员、行业专家、全球顶尖数据供应商紧密合作,从真实场景中收集反馈并分析模型表现数据,解决AI前沿突破过程中的复杂数据问题,推动模型性能与用户体验的双重提升。我们既是帮助模型技术迭代的一线贡献者,也是模型和AI产品的一手用户。

1、这个职位是连接前沿AI技术与深度专业知识的桥梁,你将不再仅仅是知识的创造者,而是整个知识增强项目的核心枢纽,负责管理从需求理解到数据交付的全链路流程,确保大模型在人文社科领域的认知与推理能力得到高效、高质量的提升;
2、与算法、产品团队紧密协作,深入理解大模型在特定领域的能力短板与迭代目标,将模糊的"模型能力提升需求"精准转化为清晰、可执行的数据生产任务与项目目标;
3、负责高质量数据生产项目的全生命周期管理,包括制定项目计划、定义数据标准、监控生产进度与风险,设计并优化数据生产的工作流,探索并落地可规模化、高效率的数据生产模式,确保项目按时、按质、按量交付;
4、建立并执行严格的数据验收标准与质检流程,对产出的结构化资料、评测数据集进行专业评估与验收,对数据质量问题进行归因分析,形成反馈闭环,持续指导和优化数据生产策略,推动数据质量的迭代提升;
5、负责领域专家资源的招募、培训与日常管理,构建并维护高质量的外部专家智库,为专家提供清晰的任务指引和必要的赋能培训,确保他们能够高效、准确地产出符合要求的数据,并对专家工作质量进行评估与管理。
包括英文材料
学历+
大模型+
相关职位

logo of bytedance
实习A181972A

日常实习:面向全体在校生,为符合岗位要求的同学提供为期3个月及以上的项目实践机会。 团队介绍:字节跳动 Seed 团队成立于 2023 年,致力于寻找通用智能的新方法,追求智能上限。团队研究方向涵盖 LLM、GenMedia、AI for Science、机器人等,在中国、新加坡、美国等地设有实验室和岗位。 Seed 团队在 AI 领域拥有长期愿景与决心,坚持深耕基础,期望成为世界一流的 AI 研究团队,为科技和社会发展作出贡献。目前团队已推出业界领先的通用大模型以及前沿的多模态能力,支持豆包、扣子、即梦等超过 50 个应用场景。 1、负责大模型数据生产领域的运营分析工作,围绕供给、质量、效率等核心环节开展监控与诊断; 2、搭建并维护业务指标体系,输出日报、周报及专题分析报告,为资源策略制定和业务决策提供支持; 3、结合业务目标,分析专家资源配置、需求匹配效率、交付质量管控、流程转化效果等问题,推动策略优化; 4、参与大模型数据生产流程的设计与优化,提升整体运营效率; 5、协助搭建Agent或自动化工具,应用于数据生产、质检、分析提效等场景。

更新于 2026-03-23北京
logo of bytedance
实习A67881

日常实习:面向全体在校生,为符合岗位要求的同学提供3个月以上的项目实践机会。 团队介绍:字节跳动豆包大模型团队成立于 2023 年,致力于开发业界最先进的 AI 大模型技术,成为世界一流的研究团队,为科技和社会发展作出贡献。 豆包大模型团队在AI领域拥有长期愿景与决心,研究方向涵盖NLP、CV、语音等,在中国、新加坡、美国等地设有实验室和研究岗位。团队依托平台充足的数据、计算等资源,在相关领域持续投入,已推出自研通用大模型,提供多模态能力,下游支持豆包、扣子、即梦等50+业务,并通过火山引擎开放给企业客户。目前,豆包APP已成为中国市场用户量最大的AIGC应用。 1、参与设计并实现高可用、可扩展、分布式机器学习平台,支持语音、音乐、多模态相关算法高效迭代; 2、构建大规模数据存储、处理、分析系统,保障Pretrain/SFT/RL各个阶段的训练数据生产,持续提升数据的规模、质量、多样性; 3、与算法同学深度合作,优化数据处理依赖的基础模型,并参与大模型的训练评测,通过数据驱动模型效果提升; 4、负责数据和AI Infrastructure前瞻技术的调研和引入,持续加强提升部门关键技术竞争力。

更新于 2024-04-30北京
logo of bytedance
实习A198180

ByteIntern:面向2026届毕业生(2025年9月-2026年8月期间毕业),为符合岗位要求的同学提供转正机会。 团队介绍:CQC(中国内容质量与数据服务平台)归属于抖音集团,负责今日头条、抖音、西瓜等产品内容和抖音集团商业内容的安全质量与体验,支持各产品的运营和增长,以及为产品线提供AI算法算力的基础支持服务。 1、参与大语言模型在垂直领域的数据生产与优化,负责通用主题问题的理解与逻辑拆解,明确任务目标与关键信息,针对模型生成的初始回答,识别逻辑漏洞或语言不通顺之处,通过自动化手段进行高质量改写,确保标注数据的准确性与实验有效性; 2、从用户视角理解并处理复杂开放式问题,具备良好的问题拆解与关键词提取能力,逻辑清晰地补全思考链路,能够自然流畅地组织信息,进行事实、推理、观点的区分与表达,擅长识别模型输出中的逻辑不一致与语义偏差; 3、跨团队协作,与算法、产品等团队紧密配合,深入理解垂类方向用户需求及模型特性,不断迭代标注标准,提升数据质量与准确性; 4、关注行业动态与先进实践,持续关注大语言模型的发展趋势,探索数据生产在模型能力提升中的作用,学习并应用行业先进的数据生产方法于数据生产工作中。

更新于 2025-09-05北京
logo of bytedance
实习A163611A

日常实习:面向全体在校生,为符合岗位要求的同学提供为期3个月及以上的项目实践机会。 团队介绍:CQC(中国内容质量与数据服务平台)归属于抖音集团,负责今日头条、抖音、西瓜等产品内容和抖音集团商业内容的安全质量与体验,支持各产品的运营和增长,以及为产品线提供AI算法算力的基础支持服务。 1、参与大语言模型在垂直领域的数据生产与优化,负责通用主题问题的理解与逻辑拆解,明确任务目标与关键信息,针对模型生成的初始回答,识别逻辑漏洞或语言不通顺之处,通过自动化手段进行高质量改写,确保标注数据的准确性与实验有效性; 2、从用户视角理解并处理复杂开放式问题,具备良好的问题拆解与关键词提取能力,逻辑清晰地补全思考链路,能够自然流畅地组织信息,进行事实、推理、观点的区分与表达,擅长识别模型输出中的逻辑不一致与语义偏差; 3、跨团队协作,与算法、产品等团队紧密配合,深入理解垂类方向用户需求及模型特性,不断迭代标注标准,提升数据质量与准确性; 4、关注行业动态与先进实践,持续关注大语言模型的发展趋势,探索数据生产在模型能力提升中的作用,学习并应用行业先进的数据生产方法于数据生产工作中。

更新于 2025-09-05北京