logo of bytedance

字节跳动文本大模型能力探索实习生(哲学方向)-内容质量与数据服务平台

实习兼职A166395B地点:北京状态:招聘

任职要求


1、本科及以上学历在读,哲学专业优先;
2、熟悉NLP、CV相关的算法和技术优先,熟悉大模型训练、SFTRL算法者优先;
3、创新能力比较强,对于不断探索新的AI技术和应用场景有较强意愿和主观能动性;
4、具有出色的分析、解决问题的能力,能深入解决大模型训练和应用存在的问题,有自主探索解决方案的能力者优先;
5、具有良好的沟通协作能力,工作积极主动,能够与团队融洽合作,一起探索新技术,推进技术进步。

工作职责


日常实习:面向全体在校生,为符合岗位要求的同学提供为期3个月及以上的项目实践机会。
团队介绍:抖音集团内容质量与数据服务平台(DOUYIN GROUP CONTENT QUALITY AND DATA SERVICE,简称CQC)是负责抖音集团今日头条、抖音、西瓜等产品内容安全与质量工作的团队,在各产品运营增长方面开展支持工作,为产品线提供数据服务的基础支持。平台下设内容质量中心、数据中心及运营支持中心,在全国10余个城市有业务分布。

1、负责提升大模型“智商”,全链路(包含Pretrain、SFT、RLHF等)提升大模型的模型效果;
2、持续跟踪业界前沿研究进展,和团队一起建立深入广泛的领域技术认知,推动研究成果实际落地,产生广泛影响力;
3、深度参与到探索项目,探索大模型数据生产方法和数据形式,实现大模型能力的突破。
包括英文材料
学历+
NLP+
算法+
大模型+
SFT+
强化学习+
相关职位

logo of bytedance
实习A198180

ByteIntern:面向2026届毕业生(2025年9月-2026年8月期间毕业),为符合岗位要求的同学提供转正机会。 团队介绍:CQC(中国内容质量与数据服务平台)归属于抖音集团,负责今日头条、抖音、西瓜等产品内容和抖音集团商业内容的安全质量与体验,支持各产品的运营和增长,以及为产品线提供AI算法算力的基础支持服务。 1、参与大语言模型在垂直领域的数据生产与优化,负责通用主题问题的理解与逻辑拆解,明确任务目标与关键信息,针对模型生成的初始回答,识别逻辑漏洞或语言不通顺之处,通过自动化手段进行高质量改写,确保标注数据的准确性与实验有效性; 2、从用户视角理解并处理复杂开放式问题,具备良好的问题拆解与关键词提取能力,逻辑清晰地补全思考链路,能够自然流畅地组织信息,进行事实、推理、观点的区分与表达,擅长识别模型输出中的逻辑不一致与语义偏差; 3、跨团队协作,与算法、产品等团队紧密配合,深入理解垂类方向用户需求及模型特性,不断迭代标注标准,提升数据质量与准确性; 4、关注行业动态与先进实践,持续关注大语言模型的发展趋势,探索数据生产在模型能力提升中的作用,学习并应用行业先进的数据生产方法于数据生产工作中。

更新于 2025-09-05
logo of bytedance
实习A163611A

日常实习:面向全体在校生,为符合岗位要求的同学提供为期3个月及以上的项目实践机会。 团队介绍:CQC(中国内容质量与数据服务平台)归属于抖音集团,负责今日头条、抖音、西瓜等产品内容和抖音集团商业内容的安全质量与体验,支持各产品的运营和增长,以及为产品线提供AI算法算力的基础支持服务。 1、参与大语言模型在垂直领域的数据生产与优化,负责通用主题问题的理解与逻辑拆解,明确任务目标与关键信息,针对模型生成的初始回答,识别逻辑漏洞或语言不通顺之处,通过自动化手段进行高质量改写,确保标注数据的准确性与实验有效性; 2、从用户视角理解并处理复杂开放式问题,具备良好的问题拆解与关键词提取能力,逻辑清晰地补全思考链路,能够自然流畅地组织信息,进行事实、推理、观点的区分与表达,擅长识别模型输出中的逻辑不一致与语义偏差; 3、跨团队协作,与算法、产品等团队紧密配合,深入理解垂类方向用户需求及模型特性,不断迭代标注标准,提升数据质量与准确性; 4、关注行业动态与先进实践,持续关注大语言模型的发展趋势,探索数据生产在模型能力提升中的作用,学习并应用行业先进的数据生产方法于数据生产工作中。

更新于 2025-09-05
logo of mi
实习

职位描述: 我们正在寻找专注于提升大模型在科学推理领域能力的研究员,重点优化模型在人文社会科学、心理学、哲学、数学、物理、生物/医学、化学、计算机科学/人工智能、工程等领域的理解与推理能力,推动大模型在复杂科学问题上的表现,使其能够解决类似人类高水平考试中的问题。 岗位职责: 1. 优化模型推理能力:研究并优化大模型在数学、物理、生物/医学、计算机科学、工程、人文社科、心理学、哲学、农学等领域的推理能力。 2. 开发科学基准测试:构建科学推理任务与评测方法,衡量模型在复杂学术问题上的表现。 3. 训练数据集构建:收集和整理高质量的科学数据,以支持模型强化学习训练。 4. 多模态推理:结合文本、公式、图像、实验数据等多种数据类型,探索提升大模型科学推理能力的方案。

更新于 2025-02-21
logo of bytedance
实习A185165

日常实习:面向全体在校生,为符合岗位要求的同学提供为期3个月及以上的项目实践机会。 团队介绍:团队介绍:TikTok是一个覆盖150个国家和地区的国际短视频平台,我们希望通过TikTok发现真实、有趣的瞬间,让生活更美好。TikTok 在全球各地设有办公室,全球总部位于洛杉矶和新加坡,办公地点还包括纽约、伦敦、都柏林、巴黎、柏林、迪拜、雅加达、首尔和东京等多个城市。 TikTok LIVE 作为一种新的内容形式,为生态各方创造价值。直播为用户提供独特的内容和消费体验;直播为创作者找到合适的观众,提供最好的工具和一系列盈利模式;通过直播,平台也能从中获得健康、客观的分成收益,直播也是 TikTok 三个主要收入来源之一。 创作者和平台有一种美妙的共生关系,我们帮助创作者创造生计、改变他们的生活;作为平台,我们也可以从中获益、持续发展。我们一直听到这样的故事 —— “LIVE changes my life”。他们更好,我们才会更好。 加入我们,一起探索 “不可能的事”—— 我们是行业的先行者,在一步步改变行业。我们持续让行业了解直播是一种新的内容形式,是创作者可以依赖的商业模式。在几年前,没有人能想象直播会发展成今天的状态。现在,每月都有几百个合作伙伴加入,和我们一起助力创作者。在可见的一年中,我们还会看到电商为直播带来的新变化和发展。 1、负责文本生成模型训练相关的数据收集、标注和整理; 2、负责大模型生成内容的效果评估,改进生成内容质量; 3、收集LLM用户反馈,帮助垂类业务LLM产品落地。

更新于 2025-04-28