logo of bytedance

字节跳动数据科学实习生(LLM智能标注)-数据科学

实习兼职A01285地点:北京状态:招聘

任职要求


1、本科及以上学历在读,计算机科学、软件工程、人工智能、数据科学等相关专业优先;
2、较强英语读写能力,雅思6.5/托福95/六级550以上;
3、掌握Python/SQL,了解LLM/深度学习/机器学习/大数据处理的基本框架和常用的统计,分析方法,熟悉计算机视觉(CV)、自然语言处理NLP)和生成模型(如GPTBERT等)的基本原理和应用,有LLM应用领域经验者优先;
4、有海外生活留学经历优先考虑;每周4天以上,实习周期3个月以上。

工作职责


日常实习:面向全体在校生,为符合岗位要求的同学提供为期3个月及以上的项目实践机会。
团队介绍:字节跳动国际化短视频的数据科学团队负责运用专业的统计学知识和技能、出色的商业思维为数亿用户提供更优质的使用体验,期待有志同道合的新伙伴加入!

1、智能标注支持与优化:使用AIGC/LLM/多模态模型为商业化数据标注项目提供高质量的智能标注解决方案,包括利用Promt Engineering、RAG搭建LLM agent、多模态模型训练支持数据的自动标注与辅助标注;设计和实施数据增强策略,分析模型输出数据,识别潜在问题并提出改进建议;
2、模型评估与调优:开发评估指标和测试框架,评估AIGC/LLM或深度模型在不同应用场景中的表现;基于数据分析结果,提出模型调优方案,并落地实施;
3、数据驱动决策:通过数据分析和挖掘,为产品团队提供数据驱动的决策支持;跟踪行业最新趋势,探索AIGC/LLM领域的新数据源和应用场景;
4、跨团队协作:与算法工程师、产品经理、业务团队紧密合作,确保数据支持与业务需求对齐;参与项目需求讨论,提供数据科学角度的专业建议;
5、英语沟通:支持纯英文环境下,跨多团队,多国家地区的项目沟通与协调。
包括英文材料
学历+
数据科学+
Python+
SQL+
大模型+
深度学习+
机器学习+
OpenCV+
NLP+
GPT+
BERT+
相关职位

logo of bytedance
实习A10233A

日常实习:面向全体在校生,为符合岗位要求的同学提供为期3个月及以上的项目实践机会。 团队介绍:飞书是 AI 时代先进生产力平台,提供一站式工作协同、组织管理、业务提效工具和深入企业场景的 AI 能力,助力企业能增长,有巧降。 从互联网、高科技、消费零售,到制造、金融、医疗健康等,各行各业先进企业都在选择飞书,与飞书共创行业最佳实践。先进团队,先用飞书。 1、负责飞书相关业务场景下的测评相关任务,对相关的产品功能进行分析和测评; 2、协助管理、构建、收集清洗、标注数据,对实际应用的效果进行评估和反馈,协助研发进行优化; 3、可以使用Python、SQL等工具进行数据处理与分析,支持业务需求; 4、应用大语言模型(LLM)相关技术进行批量化数据标注、生产和评估。

更新于 2025-05-26
logo of lilith
实习算法模型

1. 运用 Python 语言进行基于大模型的RAG数据应用开发,基于对历史SQL、专有知识库的相关物料的理解,为数据产品提供相关的AI Agent开发支持; 2. 开展 prompt 工程相关工作,根据不同业务场景与需求,设计、优化和测试 prompt,通过不断迭代提升大模型在各类任务中的表现,如SQL纠错、SQL生成、数据问答系统等; 3. 协助进行大模型应用的效果评估,建立评估指标体系,分析模型输出结果,提出改进建议并参与优化工作,持续提升数据应用的AI服务的有效性; 4. 探索基于开源大模型进行finetune操作,利用专有数据标注对模型进行有针对性的训练,使其更贴合公司特定业务领域的数据应用需求。

更新于 2025-07-17
logo of bytedance
实习A111921A

日常实习:面向全体在校生,为符合岗位要求的同学提供为期3个月及以上的项目实践机会。 团队介绍:抖音集团内容质量与数据服务平台(DOUYIN GROUP CONTENT QUALITY AND DATA SERVICE,简称CQC)是负责抖音集团今日头条、抖音、西瓜等产品内容安全与质量工作的团队,在各产品运营增长方面开展支持工作,为产品线提供数据服务的基础支持。平台下设内容质量中心、数据中心及运营支持中心,在全国10余个城市有业务分布。 1、深入理解AI大模型,产出在Agent/多模态等方向的高质量数据; 2、能通过代码和Prompt Engineering,完成数据挖掘、预处理、数据分析、链路搭建等任务; 3、与产品研发团队进行沟通协作,参与业务场景定义、数据标准制定、标注策略迭代、数据生产自动化等; 4、针对大模型的突出问题,与产品、算法、标注、评估等团队合作进行专项攻坚。

更新于 2025-06-23
logo of bytedance
实习A31963C

日常实习:面向全体在校生,为符合岗位要求的同学提供为期3个月及以上的项目实践机会。 团队介绍:抖音集团内容质量与数据服务平台(DOUYIN GROUP CONTENT QUALITY AND DATA SERVICE,简称CQC)是负责抖音集团今日头条、抖音、西瓜等产品内容安全与质量工作的团队,在各产品运营增长方面开展支持工作,为产品线提供数据服务的基础支持。平台下设内容质量中心、数据中心及运营支持中心,在全国10余个城市有业务分布。 1、深入理解AI大模型,产出在Agent/多模态等方向的高质量数据; 2、能通过代码和Prompt Engineering,完成数据挖掘、预处理、数据分析、链路搭建等任务; 3、与产品研发团队进行沟通协作,参与业务场景定义、数据标准制定、标注策略迭代、数据生产自动化等; 4、针对大模型的突出问题,与产品、算法、标注、评估等团队合作进行专项攻坚。

更新于 2025-08-15