字节跳动AI数据开发实习生-Seed

实习兼职A150676A2025-06-09地点：北京状态：招聘

扫码手机上打开

任职要求

1、硕士及以上学位在读，计算机、人工智能等专业优先；
2、熟练掌握文本、多模态等非结构化数据处理方法，熟悉数据清洗、特征提取和数据增强等技术，能够解决数据工作中各种问题；
3、精通Python、Golang、Java等至少一种编程语言，具备良好的编码能力和代码质量意识，熟悉常用的数据处理、文本处理和图像处理库，能够高效地实现数据…

登录查看完整任职要求

微信扫码，1秒登录

工作职责

日常实习：面向全体在校生，为符合岗位要求的同学提供为期3个月及以上的项目实践机会。
团队介绍：字节跳动 Seed 团队成立于 2023 年，致力于寻找通用智能的新方法，追求智能上限。团队研究方向涵盖 LLM、语音、视觉、世界模型、基础架构、AI Infra、下一代 AI 交互等，在中国、新加坡、美国等地设有实验室和岗位。
Seed 团队在 AI 领域拥有长期愿景与决心，坚持深耕基础，期望成为世界一流的 AI 研究团队，为科技和社会发展作出贡献。目前团队已推出业界领先的通用大模型以及前沿的多模态能力，支持豆包、扣子、即梦等超过 50 个应用场景。

1、负责Seed-AI平台大模型规模化训练数据自动化处理全流程相关开发工作，包括但不限于数据搜集、预处理、打标、入库、检索等；
2、负责构建针对不同场景、不同数据类型、不同数据规模有足够的扩展性的数据处理技术链路和框架，以支撑大模型数据集持续高效迭代，实现高质量数据集沉淀；
3、负责数据生成和数据增强，利用大模型工具生成来扩充和完善数据集。

📮 投递简历 ✨AI模拟面试

难度：

包括英文材料

学历+

Python+

Go+

Java+

图像处理+

算法+

还有更多 •••

登录查看完整学习资料

相关职位

AI数据开发实习生-Seed

实习A51883

日常实习：面向全体在校生，为符合岗位要求的同学提供为期3个月及以上的项目实践机会。团队介绍：字节跳动 Seed 团队成立于 2023 年，致力于寻找通用智能的新方法，追求智能上限。团队研究方向涵盖 LLM、语音、视觉、世界模型、基础架构、AI Infra、下一代 AI 交互等，在中国、新加坡、美国等地设有实验室和岗位。 Seed 团队在 AI 领域拥有长期愿景与决心，坚持深耕基础，期望成为世界一流的 AI 研究团队，为科技和社会发展作出贡献。目前团队已推出业界领先的通用大模型以及前沿的多模态能力，支持豆包、扣子、即梦等超过 50 个应用场景。 1、负责千亿级别海量数据的管理，包括数据的存储，数据处理，数据安全，数据校验等等； 2、负责数据链路基建的研发，追求极致的处理速度，达到百万QPS的处理能力； 3、大规模数据的分析以及可视化的建设，从数据中挖掘出影响模型训练结果的可能因素，从而帮助模型训练改进； 4、与算法同学深度合作，加速训练数据的获取，提升数据质量，支持模型结果数据评测，打造数据闭环； 5、支持数据分析和数据可视化工作，降低数据的获取门槛，提升数据的使用价值。

更新于 2024-12-16北京

大模型训练优化研发实习生-Seed

实习A258772

日常实习：面向全体在校生，为符合岗位要求的同学提供为期3个月及以上的项目实践机会。团队介绍：字节跳动 Seed 团队成立于 2023 年，致力于寻找通用智能的新方法，追求智能上限。团队研究方向涵盖 LLM、语音、视觉、世界模型、基础架构、AI Infra、下一代 AI 交互等，在中国、新加坡、美国等地设有实验室和岗位。 Seed 团队在 AI 领域拥有长期愿景与决心，坚持深耕基础，期望成为世界一流的 AI 研究团队，为科技和社会发展作出贡献。目前团队已推出业界领先的通用大模型以及前沿的多模态能力，支持豆包、扣子、即梦等超过 50 个应用场景。 1、负责大规模机器学习系统架构的设计开发，解决系统高并发、高可靠性、高可扩展性等技术难关； 2、覆盖机器学习系统多个子方向领域的工作，包括：资源调度、分布式模型训练、数据管理、高性能计算等； 3、负责机器学习系统前瞻技术的调研和引入，比如：最新硬件架构、异构计算系统、编译优化技术、强化学习RL/Agent环境交互技术等的引入落地； 4、与算法部门深度合作，进行算法与系统的联合优化。

更新于 2025-05-14北京

AIGC模型优化实习生-Seed

实习A229204

日常实习：面向全体在校生，为符合岗位要求的同学提供为期3个月及以上的项目实践机会。团队介绍：字节跳动 Seed 团队成立于 2023 年，致力于寻找通用智能的新方法，追求智能上限。团队研究方向涵盖 LLM、语音、视觉、世界模型、基础架构、AI Infra、下一代 AI 交互等，在中国、新加坡、美国等地设有实验室和岗位。 Seed 团队在 AI 领域拥有长期愿景与决心，坚持深耕基础，期望成为世界一流的 AI 研究团队，为科技和社会发展作出贡献。目前团队已推出业界领先的通用大模型以及前沿的多模态能力，支持豆包、扣子、即梦等超过 50 个应用场景。 1、参与模型训练/推理优化算法的研究与开发，运用数据并行、模型并行、通信优化等前沿技术，提升模型训练/推理速度及效率； 2、开发和优化AI研发场景下的工具和方法，持续改进并行训练/推理模型的框架和策略，以满足公司业务的需求； 3、对业务进行性能瓶颈分析，实施模型训练/推理性能优化措施，提升训练/推理效率，同时利用硬件特性最大化资源效用，并与业界技术进步保持同步。

更新于 2024-05-30上海

大模型训练编排调度研发实习生-Seed

实习A145767

日常实习：面向全体在校生，为符合岗位要求的同学提供为期3个月及以上的项目实践机会。团队介绍：字节跳动 Seed 团队成立于 2023 年，致力于寻找通用智能的新方法，追求智能上限。团队研究方向涵盖 LLM、语音、视觉、世界模型、基础架构、AI Infra、下一代 AI 交互等，在中国、新加坡、美国等地设有实验室和岗位。 Seed 团队在 AI 领域拥有长期愿景与决心，坚持深耕基础，期望成为世界一流的 AI 研究团队，为科技和社会发展作出贡献。目前团队已推出业界领先的通用大模型以及前沿的多模态能力，支持豆包、扣子、即梦等超过 50 个应用场景。 1、参与大模型训练场景编排调度系统和容错系统的架构设计、开发、优化工作，解决系统高并发、高可靠性、高可扩展性等难题； 2、负责机器学习系统前瞻技术的调研和引入，比如：最新硬件架构、硬件故障检测、强化学习RL/Agent环境交互技术； 3、与算法团队合作，进行框架与系统的联合优化。

更新于 2025-06-04杭州