logo of bytedance

字节跳动AI数据运营实习生(Agent研究)-内容质量与数据服务平台

实习兼职A256383A地点:北京状态:招聘

任职要求


1、本科及以上学历在读,人工智能、计算机、大数据等相关专业优先;
2、必须具备英文文献阅读能力,了解AI领域最近发表的论文,发表过计算机相关国际论文优先;
3、掌握提示词工程,理解Agent实现原理,有Workflow搭建经验,熟练使用PythonSQLJava等编程语言,了解机器学习/人工智能/模型调优;
4、对AI有高度热情,有较强的自驱、学习、沟通和抗压能力,能实习4个月以上的优先考虑。

工作职责


日常实习:面向全体在校生,为符合岗位要求的同学提供为期3个月及以上的项目实践机会。
团队介绍:抖音集团内容质量与数据服务平台(DOUYIN GROUP CONTENT QUALITY AND DATA SERVICE,简称CQC)是负责抖音集团今日头条、抖音、西瓜等产品内容安全与质量工作的团队,在各产品运营增长方面开展支持工作,为产品线提供数据服务的基础支持。平台下设内容质量中心、数据中心及运营支持中心,在全国10余个城市有业务分布。

1、深入理解AI大模型,推动Agent、VLM、LLM的数据合成/数据有效性/模型评估等关键主题的研究并撰写论文;
2、针对大模型的突出问题,与产品研发、数据、评估团队协作,将科研成果应用到实际业务场景、数据标准、策略迭代、数据生产自动化等方面;
3、参与Agent评估集的设计与构建,提升模型在Agent应用场景的表现;
4、通过代码和提示词工程(PE),完成数据挖掘、预处理、数据分析、链路搭建等任务。
包括英文材料
学历+
大数据+
AI agent+
Python+
SQL+
Java+
机器学习+
相关职位

logo of bytedance
实习A163611A

日常实习:面向全体在校生,为符合岗位要求的同学提供为期3个月及以上的项目实践机会。 团队介绍:CQC(中国内容质量与数据服务平台)归属于抖音集团,负责今日头条、抖音、西瓜等产品内容和抖音集团商业内容的安全质量与体验,支持各产品的运营和增长,以及为产品线提供AI算法算力的基础支持服务。 1、参与大语言模型在垂直领域的数据生产与优化,负责通用主题问题的理解与逻辑拆解,明确任务目标与关键信息,针对模型生成的初始回答,识别逻辑漏洞或语言不通顺之处,通过自动化手段进行高质量改写,确保标注数据的准确性与实验有效性; 2、从用户视角理解并处理复杂开放式问题,具备良好的问题拆解与关键词提取能力,逻辑清晰地补全思考链路,能够自然流畅地组织信息,进行事实、推理、观点的区分与表达,擅长识别模型输出中的逻辑不一致与语义偏差; 3、跨团队协作,与算法、产品等团队紧密配合,深入理解垂类方向用户需求及模型特性,不断迭代标注标准,提升数据质量与准确性; 4、关注行业动态与先进实践,持续关注大语言模型的发展趋势,探索数据生产在模型能力提升中的作用,学习并应用行业先进的数据生产方法于数据生产工作中。

更新于 2025-09-05
logo of bytedance
实习A198180

ByteIntern:面向2026届毕业生(2025年9月-2026年8月期间毕业),为符合岗位要求的同学提供转正机会。 团队介绍:CQC(中国内容质量与数据服务平台)归属于抖音集团,负责今日头条、抖音、西瓜等产品内容和抖音集团商业内容的安全质量与体验,支持各产品的运营和增长,以及为产品线提供AI算法算力的基础支持服务。 1、参与大语言模型在垂直领域的数据生产与优化,负责通用主题问题的理解与逻辑拆解,明确任务目标与关键信息,针对模型生成的初始回答,识别逻辑漏洞或语言不通顺之处,通过自动化手段进行高质量改写,确保标注数据的准确性与实验有效性; 2、从用户视角理解并处理复杂开放式问题,具备良好的问题拆解与关键词提取能力,逻辑清晰地补全思考链路,能够自然流畅地组织信息,进行事实、推理、观点的区分与表达,擅长识别模型输出中的逻辑不一致与语义偏差; 3、跨团队协作,与算法、产品等团队紧密配合,深入理解垂类方向用户需求及模型特性,不断迭代标注标准,提升数据质量与准确性; 4、关注行业动态与先进实践,持续关注大语言模型的发展趋势,探索数据生产在模型能力提升中的作用,学习并应用行业先进的数据生产方法于数据生产工作中。

更新于 2025-09-05
logo of bytedance
实习A58912

团队介绍:V-AI团队当前支持抖音直播、开放平台、V项目(AI分身/小火人等)业务方向,涵盖了自然语言处理、计算机视觉、图形学等技术领域,通过大模型技术来创造新的互动玩法、制作美术资产、提升研发运营效率等,当前已上线和开展中的项目包括直播大模型(助播/伴播/独播)、角色多模态对话大模型、研发智能助手、3D模型生成大模型、动作生成大模型等。 课题介绍: 背景:随着虚拟现实、增强现实、数字孪生等技术的快速应用,3D数字资产已成为构建沉浸式数字空间的核心要素。在影视动画、游戏开发、直播、社交等领域,3D模型与3D动作的需求呈现爆发式增长。然而,传统3D内容生产高度依赖人工建模与动作捕捉技术,存在效率低、成本高、创作门槛高等瓶颈,难以满足直播等场景中大规模、高保真、多样化、高频迭代的3D内容需求。近年来,以生成式人工智能(AIGC)为代表的大模型技术在2D图像与视频生成领域取得突破性进展,但在3D内容生成领域仍面临表征复杂、多模态数据稀缺、物理规律约束严格等难题。如何将大模型技术与3D生成任务深度融合,实现“文本/图像到3D模型”、“文本/语音到动作”的高质量生成,形成建模+驱动的一站式美术资产生成管线以适配直播场景下资产迭代速度快,品质要求高的需求是当前的重要研究内容。 课题挑战: 传统方法依赖人工建模工具或程序化生成算法,存在生成效率与创作自由度之间的固有矛盾。AI技术虽然能很好地弥补人工生成效率不足的问题,但仍然存在如下挑战 1. 表征困难:与一维文本和二维图像可以自然地实现结构化表征不同,3D模型由于其多模态(如几何、纹理、材质等)、结构复杂和高维度等特性,使得其表征更为复杂。而3D动作又与物理世界紧密相关,且动态复杂度高。因此,如何高效地表征3D几何形状和3D动作,同时确保高品质的生成,仍然是亟需突破的课题。 2. 生成困难:模型生成需同时保障结构完整性、拓扑合理性和细节丰富性;动作生成需兼顾运动多样性、物理约束与时空连续性。现有方法易出现模型畸变、贴图瑕疵、动作力度不足和多样性差等问题。 3. 数据不足:3D数据标注成本高、多模态对齐难度大,且现有公开数据集规模有限,导致大模型训练面临数据不足的问题;如何把相关模态数据(图像、视频)利用起来,提升3D模型和3D动作的生成品质也是当前的重大挑战。 4. 评估体系不完善:缺乏统一的3D生成质量量化指标,现有评价多依赖人工主观判断,难以客观衡量生成的几何精度、动作自然度与多模态语义一致性,因此建立完善、客观、可量化的评价体系是保障技术迭代的关键基石。 1、负责抖音、抖音直播及相关产品的大语言模型/多模态大模型/AIGC算法研发,如数字人、3D生成、动作生成、智能对话等相关工作; 2、负责关键场景的算法优化,构建高质量的模型和Agent系统,提升业务效果; 3、跟踪AI前沿技术进展,推动前沿技术的产品化落地。

更新于 2025-03-03
logo of bytedance
实习A227228

团队介绍:V-AI团队当前支持抖音直播、开放平台、V项目(AI分身/小火人等)业务方向,涵盖了自然语言处理、计算机视觉、图形学等技术领域,通过大模型技术来创造新的互动玩法、制作美术资产、提升研发运营效率等,当前已上线和开展中的项目包括直播大模型(助播/伴播/独播)、角色多模态对话大模型、研发智能助手、3D模型生成大模型、动作生成大模型等。 课题介绍: 背景:随着虚拟现实、增强现实、数字孪生等技术的快速应用,3D数字资产已成为构建沉浸式数字空间的核心要素。在影视动画、游戏开发、直播、社交等领域,3D模型与3D动作的需求呈现爆发式增长。然而,传统3D内容生产高度依赖人工建模与动作捕捉技术,存在效率低、成本高、创作门槛高等瓶颈,难以满足直播等场景中大规模、高保真、多样化、高频迭代的3D内容需求。近年来,以生成式人工智能(AIGC)为代表的大模型技术在2D图像与视频生成领域取得突破性进展,但在3D内容生成领域仍面临表征复杂、多模态数据稀缺、物理规律约束严格等难题。如何将大模型技术与3D生成任务深度融合,实现“文本/图像到3D模型”、“文本/语音到动作”的高质量生成,形成建模+驱动的一站式美术资产生成管线以适配直播场景下资产迭代速度快,品质要求高的需求是当前的重要研究内容。 课题挑战: 传统方法依赖人工建模工具或程序化生成算法,存在生成效率与创作自由度之间的固有矛盾。AI技术虽然能很好地弥补人工生成效率不足的问题,但仍然存在如下挑战 1. 表征困难:与一维文本和二维图像可以自然地实现结构化表征不同,3D模型由于其多模态(如几何、纹理、材质等)、结构复杂和高维度等特性,使得其表征更为复杂。而3D动作又与物理世界紧密相关,且动态复杂度高。因此,如何高效地表征3D几何形状和3D动作,同时确保高品质的生成,仍然是亟需突破的课题。 2. 生成困难:模型生成需同时保障结构完整性、拓扑合理性和细节丰富性;动作生成需兼顾运动多样性、物理约束与时空连续性。现有方法易出现模型畸变、贴图瑕疵、动作力度不足和多样性差等问题。 3. 数据不足:3D数据标注成本高、多模态对齐难度大,且现有公开数据集规模有限,导致大模型训练面临数据不足的问题;如何把相关模态数据(图像、视频)利用起来,提升3D模型和3D动作的生成品质也是当前的重大挑战。 4. 评估体系不完善:缺乏统一的3D生成质量量化指标,现有评价多依赖人工主观判断,难以客观衡量生成的几何精度、动作自然度与多模态语义一致性,因此建立完善、客观、可量化的评价体系是保障技术迭代的关键基石。 1、负责抖音、抖音直播及相关产品的大语言模型/多模态大模型/AIGC算法研发,如数字人、3D生成、动作生成、智能对话等相关工作; 2、负责关键场景的算法优化,构建高质量的模型和Agent系统,提升业务效果; 3、跟踪AI前沿技术进展,推动前沿技术的产品化落地。

更新于 2025-03-03