logo of bytedance

字节跳动机器学习平台研发实习生-Data语音

实习兼职A199336地点:杭州状态:招聘

任职要求


1、2026届本科及以上学历在读,计算机、软件工程等相关专业优先;
2、有自然语言处理、语音合成与识别、音乐生成等研究或者技术背景优先;
3、优秀的代码能力,熟悉C/C++/Python等至少一种编程语言;
4、扎实的机器学习基础,熟练掌握PytorchTensorFlow深度学习框架;
5、熟悉分布式系统原理,参与过大规模分布式系统的设计、开发;
6、出色的问题分析和解决能力,能深入解决大模型数据和训练的问题,有自主探索解决方案的能力。

工作职责


ByteIntern:面向2026届毕业生(2025年9月-2026年8月期间毕业),为符合岗位要求的同学提供转正机会。
团队介绍:Data语音团队致力于语音/音频/音乐相关的AI核心技术研发和产品创新。部门支撑音频和多模态内容从生产、编辑到消费的全流程,赋能内容创作和互动,并以中台形式支持集团多个业务,提供业界前沿的技术能力与解决方案。

1、参与设计并实现高可用、可扩展、分布式机器学习平台,支持语音、音乐、多模态相关算法高效迭代;
2、构建大规模数据存储、处理、分析系统,保障Pretrain/SFT/RL各个阶段的训练数据生产,持续提升数据的规模、质量、多样性;
3、与算法同学深度合作,优化数据处理依赖的基础模型,并参与大模型的训练评测,通过数据驱动模型效果提升;
4、负责数据和AI Infrastructure前瞻技术的调研和引入,持续加强提升部门关键技术竞争力。
包括英文材料
学历+
NLP+
C+
C+++
Python+
机器学习+
PyTorch+
TensorFlow+
深度学习+
分布式系统+
大模型+
相关职位

logo of bytedance
实习A13985

ByteIntern:面向2026届毕业生(2025年9月-2026年8月期间毕业),为符合岗位要求的同学提供转正机会。 团队介绍:Data语音团队致力于语音/音频/音乐相关的AI核心技术研发和产品创新。部门支撑音频和多模态内容从生产、编辑到消费的全流程,赋能内容创作和互动,并以中台形式支持集团多个业务,提供业界前沿的技术能力与解决方案。 1、参与设计并实现高可用、可扩展、分布式机器学习平台,支持语音、音乐、多模态相关算法高效迭代; 2、构建大规模数据存储、处理、分析系统,保障Pretrain/SFT/RL各个阶段的训练数据生产,持续提升数据的规模、质量、多样性; 3、与算法同学深度合作,优化数据处理依赖的基础模型,并参与大模型的训练评测,通过数据驱动模型效果提升; 4、负责数据和AI Infrastructure前瞻技术的调研和引入,持续加强提升部门关键技术竞争力。

更新于 2025-02-13
logo of bytedance
实习A38359

ByteIntern:面向2026届毕业生(2025年9月-2026年8月期间毕业),为符合岗位要求的同学提供转正机会。 团队介绍:Data语音团队致力于语音/音频/音乐相关的AI核心技术研发和产品创新。部门支撑音频和多模态内容从生产、编辑到消费的全流程,赋能内容创作和互动,并以中台形式支持集团多个业务,提供业界前沿的技术能力与解决方案。 1、参与设计并实现高可用、可扩展、分布式机器学习平台,支持语音、音乐、多模态相关算法高效迭代; 2、构建大规模数据存储、处理、分析系统,保障Pretrain/SFT/RL各个阶段的训练数据生产,持续提升数据的规模、质量、多样性; 3、与算法同学深度合作,优化数据处理依赖的基础模型,并参与大模型的训练评测,通过数据驱动模型效果提升; 4、负责数据和AI Infrastructure前瞻技术的调研和引入,持续加强提升部门关键技术竞争力。

更新于 2025-02-18
logo of bytedance
实习A133346

ByteIntern:面向2026届毕业生(2025年9月-2026年8月期间毕业),为符合岗位要求的同学提供转正机会。 团队介绍:Data AML是字节跳动公司的机器学习中台,为抖音/今日头条/西瓜视频等业务提供推荐/广告/CV/语音/NLP的训练和推理系统。为公司内业务部门提供强大的机器学习算力,并在这些业务的问题上研究一些具有通用性和创新性的算法。同时,也通过火山引擎将一些机器学习/推荐系统的核心能力提供给外部企业客户。此外,AML还在AI for Science,科学计算等领域做一些前沿研究。 1、负责机器学习训练推理架构设计和开发; 2、参与设计系统技术方案,核心代码开发和系统调优; 3、参与制定代码规范、测试规范,建立起开发质量控制方法; 4、协助团队攻克各种高并发、数据隔离、系统解耦等方面的技术难关; 5、参与各专项技术调研,新技术引入等前瞻项目; 6、参与机器学习训练推理,异构计算调度,模型即服务系统研发。

更新于 2025-02-14
logo of bytedance
实习A06065A

日常实习:面向全体在校生,为符合岗位要求的同学提供为期3个月及以上的项目实践机会。 团队介绍:Data AML是字节跳动公司的机器学习中台,为抖音/今日头条/西瓜视频等业务提供推荐/广告/CV/语音/NLP的训练和推理系统。为公司内业务部门提供强大的机器学习算力,并在这些业务的问题上研究一些具有通用性和创新性的算法。同时,也通过火山引擎将一些机器学习/推荐系统的核心能力提供给外部企业客户。此外,AML还在AI for Science,科学计算等领域做一些前沿研究。 1、参与机器人AI平台功能模块开发,包括数据处理工具、可视化组件及自动化测试工具等平台能力; 2、探索机器人开发场景与AI模型能力结合的可能,包括3D物体生成、MCP等; 3、编写技术文档并参与代码评审,学习工业级编码规范; 4、跟进前沿技术动态,参与技术方案可行性验证。

更新于 2025-04-15