logo of bytedance

字节跳动VLM数据运营实习生(基础模型)-大模型数据服务中心

实习兼职A255593地点:北京状态:招聘

任职要求


1、本科及以上学历在读,计算机科学、人工智能、数学、物理等相关理工科专业;
2、具备大模型训练、微调、应用开发或网页爬取等相关技术经验者优先;拥有扎实的计算机网络、多线程等知识基础,能熟练运用Python及Pandas、NumPy等三方库完成数据处理工作,熟悉视觉基础原理、接口技术及提示工程,有LLM/VLM标注方案构建经验者优先;
3、对前沿科技有强烈探索欲,主动追踪行业最新论文与研究成果,热衷于…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


日常实习:面向全体在校生,为符合岗位要求的同学提供为期3个月及以上的项目实践机会。
团队介绍:大模型数据服务中心,是抖音集团旗下为大模型业务提供数据、评估、运营等专业解决方案的团队;
主要承接大模型数据生产、大模型评估及运营相关的业务,与研发、产品等团队紧密合作,在预训练、数据监督微调、模型强化学习、模型能力评估、产品运营等大模型全链路数据环节,共同推动模型能力持续提升与应用。

1、主导核心方向数据生产全流程管控,对数据质量与交付效率负总责,紧密联动模型迭代环节,确保数据供给与模型效果优化同频共振;
2、结合视觉理解模型的核心能力场景,制定科学规范的数据生产标准与流程,并持续迭代优化;主动设计并落地数据生产效率提升、模型效果优化相关实验,输出客观严谨的结论并反哺流程升级;
3、探索并落地多元化标注提效方案,包括但不限于标注工具优化、提示工程(PE)撰写、Agent自动化标注搭建、标注模式创新等,提升数据生产效能;
4、深度协同算法、产品团队,精准理解模型原理与算法逻辑,针对性输出数据构造、生产策略等专业建议,助力打通“数据-模型-效果”的闭环链路;
5、承担团队知识输出与带教职责,协助非技术向成员提升大语言模型相关认知与实际应用技能,赋能团队整体业务目标达成。
包括英文材料
学历+
大模型+
多线程+
还有更多 •••
相关职位

logo of bytedance
实习A256383A

日常实习:面向全体在校生,为符合岗位要求的同学提供为期3个月及以上的项目实践机会。 团队介绍:抖音集团内容质量与数据服务平台(DOUYIN GROUP CONTENT QUALITY AND DATA SERVICE,简称CQC)是负责抖音集团今日头条、抖音、西瓜等产品内容安全与质量工作的团队,在各产品运营增长方面开展支持工作,为产品线提供数据服务的基础支持。平台下设内容质量中心、数据中心及运营支持中心,在全国10余个城市有业务分布。 1、深入理解AI大模型,推动Agent、VLM、LLM的数据合成/数据有效性/模型评估等关键主题的研究并撰写论文; 2、针对大模型的突出问题,与产品研发、数据、评估团队协作,将科研成果应用到实际业务场景、数据标准、策略迭代、数据生产自动化等方面; 3、参与Agent评估集的设计与构建,提升模型在Agent应用场景的表现; 4、通过代码和提示词工程(PE),完成数据挖掘、预处理、数据分析、链路搭建等任务。

更新于 2025-08-15北京
logo of bytedance
实习A249081

ByteIntern:面向2026届毕业生(2025年9月-2026年8月期间毕业),为符合岗位要求的同学提供转正机会。 团队介绍:我们是智能服务团队,团队负责互娱业务的泛体验、泛安全问题挖掘和业务赋能,为抖音/直播/剪映/醒图/本地生活等业务,提供服务化与智能化解决方案。 团队拥有工程(FE/Server)、数据(数据工程、数据科学)、算法(大模型、NLP、CV、推荐)、产品经理等多种职能岗位,可以高效自闭环进行智能平台类产品的设计研发,具有多个公司级影响力的智能化平台产品成功落地经验。 团队年轻向上,打造工程师文化,团队年度输出了50+篇专利,10+篇行业会议分享。 1、负责字节跳动效率领域各业务场景下,进行算法应用研究与开发落地工作,业务场景包括但不限于抖音用户体验优化/智能运营/智能客服等; 2、跟踪大模型方向的最新算法研究成果,用以持续提升业务应用效果,研究方向包括但不限于模型CT、Post-training、AI Agent等技术; 3、整理研究数据,撰写技术报告、发表研究论文和申请专利; 4、深度参与产品研发项目,和产品经理/业务研发/业务质量/运营等同学密切配合,提高项目整体效率和收益。

更新于 2023-08-22深圳
logo of bytedance
实习A07393

日常实习:面向全体在校生,为符合岗位要求的同学提供为期3个月及以上的项目实践机会。 团队介绍:Data AML是字节跳动公司的机器学习中台,为抖音/今日头条/西瓜视频等业务提供推荐/广告/CV/语音/NLP的训练和推理系统。为公司内业务部门提供强大的机器学习算力,并在这些业务的问题上研究一些具有通用性和创新性的算法。同时,也通过火山引擎将一些机器学习/推荐系统的核心能力提供给外部企业客户。此外,AML还在AI for Science,科学计算等领域做一些前沿研究。 1、参与AI搜索和知识管理相关的工具产品建设与迭代; 2、建立和管理用户社群,组织用户交流活动,通过用户调研、产品调研、数据分析等方式了解和挖掘客户需求,产出需求文档; 3、负责产品使用培训,为用户提供支持,确保用户能够高效使用产品; 4、跟踪新功能的上线效果、用户反馈,为进一步优化打磨提供合理建议。

更新于 2025-07-02深圳
logo of bytedance
实习A236857A

日常实习:面向全体在校生,为符合岗位要求的同学提供为期3个月及以上的项目实践机会。 团队介绍:AML是字节跳动公司的机器学习中台,为抖音/今日头条/西瓜视频等业务提供推荐/广告/CV/语音/NLP的训练和推理系统。为公司内业务部门提供强大的机器学习算力,并在这些业务的问题上研究一些具有通用性和创新性的算法。 1、参与AI搜索和知识管理相关的工具产品建设与迭代; 2、建立和管理用户社群,组织用户交流活动,通过用户调研、产品调研、数据分析等方式了解和挖掘客户需求,产出需求文档; 3、负责产品使用培训,为用户提供支持,确保用户能够高效使用产品; 4、跟踪新功能的上线效果、用户反馈,为进一步优化打磨提供合理建议。

更新于 2025-05-22北京