logo of bytedance

字节跳动内容生态算法应用实习生-内容质量与数据服务平台

实习兼职A226475A地点:北京状态:招聘

任职要求


1、2026届本科及以上学历在读,计算机科学、数学、统计学相关专业优先;
2、熟练掌握并运用PythonSQLPandasSpark等语言,了解CV/NLP/音频常用算法,具备良好的数据分析和问题解决能力,能够独立进行模型调优和性能优化;
3、熟练掌握大模型关键技术,包括但不限于Prompt工程,微调技术、RAG等,有Hugging Face、LangChain等框架使用经验;
4、强烈的业务驱动意识,有良好的沟通表达能力和团队精神,愿意挑战复杂问题,具备优秀的跨团队协作能力和技术创新落地能力。

工作职责


ByteIntern:面向2026届毕业生(2025年9月-2026年8月期间毕业),为符合岗位要求的同学提供转正机会。
团队介绍:抖音集团内容质量与数据服务平台(DOUYIN GROUP CONTENT QUALITY AND DATA SERVICE,简称CQC)是负责抖音集团今日头条、抖音、西瓜等产品内容安全与质量工作的团队,在各产品运营增长方面开展支持工作,为产品线提供数据服务的基础支持。平台下设内容质量中心、数据中心及运营支持中心,在全国10余个城市有业务分布。

1、负责内容生态场景的模型运维业务,能够独立负责模型训练全链路工作,包括但不限于大模型调用、微调、评估优化,以及机器学习和深度学习模型的训练和工程化落地;
2、深入理解业务需求与数据特征,从业务目标达成出发设计大模型或大小模型协同解决方案,通过Prompt工程、RAG、微调等技术提升内容识别、理解、治理等场景的应用效果,优化业务流程和效率;
3、主导大模型在业务中的创新应用,包括但不限于搭建领域适合的微调方案、设计多模型融合策略、优化模型部署上线流程,推动大模型规模化落地;
4、持续跟踪AI前沿技术动态,推动大模型与行业知识库,业务规则的结合,构建可复用的模型能力中台;
5、高效、规范管理模型项目需求,做好经验沉淀,将训练经验扩展至多业务场景,保证项目投入ROI。
包括英文材料
学历+
Python+
SQL+
Pandas+
Spark+
NLP+
算法+
数据分析+
大模型+
Prompt+
RAG+
LangChain+
相关职位

logo of bytedance
实习A163611A

日常实习:面向全体在校生,为符合岗位要求的同学提供为期3个月及以上的项目实践机会。 团队介绍:CQC(中国内容质量与数据服务平台)归属于抖音集团,负责今日头条、抖音、西瓜等产品内容和抖音集团商业内容的安全质量与体验,支持各产品的运营和增长,以及为产品线提供AI算法算力的基础支持服务。 1、参与大语言模型在垂直领域的数据生产与优化,负责通用主题问题的理解与逻辑拆解,明确任务目标与关键信息,针对模型生成的初始回答,识别逻辑漏洞或语言不通顺之处,通过自动化手段进行高质量改写,确保标注数据的准确性与实验有效性; 2、从用户视角理解并处理复杂开放式问题,具备良好的问题拆解与关键词提取能力,逻辑清晰地补全思考链路,能够自然流畅地组织信息,进行事实、推理、观点的区分与表达,擅长识别模型输出中的逻辑不一致与语义偏差; 3、跨团队协作,与算法、产品等团队紧密配合,深入理解垂类方向用户需求及模型特性,不断迭代标注标准,提升数据质量与准确性; 4、关注行业动态与先进实践,持续关注大语言模型的发展趋势,探索数据生产在模型能力提升中的作用,学习并应用行业先进的数据生产方法于数据生产工作中。

更新于 2025-09-05
logo of bytedance
实习A198180

ByteIntern:面向2026届毕业生(2025年9月-2026年8月期间毕业),为符合岗位要求的同学提供转正机会。 团队介绍:CQC(中国内容质量与数据服务平台)归属于抖音集团,负责今日头条、抖音、西瓜等产品内容和抖音集团商业内容的安全质量与体验,支持各产品的运营和增长,以及为产品线提供AI算法算力的基础支持服务。 1、参与大语言模型在垂直领域的数据生产与优化,负责通用主题问题的理解与逻辑拆解,明确任务目标与关键信息,针对模型生成的初始回答,识别逻辑漏洞或语言不通顺之处,通过自动化手段进行高质量改写,确保标注数据的准确性与实验有效性; 2、从用户视角理解并处理复杂开放式问题,具备良好的问题拆解与关键词提取能力,逻辑清晰地补全思考链路,能够自然流畅地组织信息,进行事实、推理、观点的区分与表达,擅长识别模型输出中的逻辑不一致与语义偏差; 3、跨团队协作,与算法、产品等团队紧密配合,深入理解垂类方向用户需求及模型特性,不断迭代标注标准,提升数据质量与准确性; 4、关注行业动态与先进实践,持续关注大语言模型的发展趋势,探索数据生产在模型能力提升中的作用,学习并应用行业先进的数据生产方法于数据生产工作中。

更新于 2025-09-05
logo of bytedance
实习A109272

日常实习:面向全体在校生,为符合岗位要求的同学提供为期3个月及以上的项目实践机会。 团队介绍:TikTok内容生态算法团队立足于平台海量用户和短视频内容,利用多模态、LLM/MLLM、NLP&CV等技术,负责对各类内容做分析、加工、生成等内容层操作,内容形态包括但不限于短视频、图文、全网热点页面、客服对话等,产出内容理解特征、大模型生成中间页、全网热点发现&理解能力以及智能客服系统。 同时在TikTok供给侧提供面向全平台的创作灵感个性化推荐能力。 在这里,有上百个语种,NLP/LLM等技术面临多语种挑战。 在这里,有海量短视频内容,MLLM及多模态技术有更多应用场景。 平台用户量大,各项业务如本地生活、搜索等都处于高速发展期,有大量实际落地和应用场景。 1、参与海外POI质量准入及规范化、聚合、融合等算法、策略的设计和优化,持续提升POI覆盖和质量; 2、参与海外POI名称、地址、坐标、类别、虚假等数据质量挖掘及优化,提升数据质量; 3、参与POI主子点、连锁品牌等标签、关系挖掘模型的持续优化,支撑推荐、搜索等各类应用服务和场景的持续优化; 4、参与POI数据生产智能化相关算法的持续优化。

更新于 2025-01-02
logo of bytedance
实习A216706A

ByteIntern:面向2026届毕业生(2025年9月-2026年8月期间毕业),为符合岗位要求的同学提供转正机会。 团队介绍:负责公司数个产品的推荐引擎、平台开发和大数据等工作。我们的工作涉及海量数据处理和对产品数据复杂深入的分析。在这里,你可以深入钻研大数据产品的改进和优化,探索前沿的技术;可以通过对产品的深度理解和思考,将数据应用到业务中去;也可以通过对产品和内容生态的深度分析,影响产品未来的发展方向。 1、参与字节跳动公司抖音、直播等业务的数据平台的开发工作; 2、支撑抖音、直播等业务的快速迭代,实现超大规模数据量及访问量下数据服务质量保障; 3、深入理解抖音、直播等业务并沉淀相应的数据能力,实现数据资产价值的最大化。

更新于 2025-02-17