字节跳动算法引擎实习生-Data语音
任职要求
1、2026届本科及以上学历在读,计算机、软件工程等相关专业优先; 2、熟练掌握C/C++、Python语言,熟悉常用数据结构以及基础算法,对有挑战的工作富有热情; 3、熟悉业界开源框架,如TensorRT、Triton、vLLM、DeepSpeed等; 4、熟悉Transformer模型及其应用场景,如Llama2、Qwen、DeepSeek等; 5、有很强的分析问题和解决问题的能力,有强烈的责任心。 加分项: 1、在ACM/NOI/IOI/TopCoder获奖者优先; 2、有定点量化、指令集优化、深度模型优化等相关项目经验者优先; 3、有CPU、GPU、NPU、ARM、OpenCL、DSP等高性能计算优化经验者优先; 4、有相关语音信号处理、语音识别、语音合成或者自然语言处理经验的优先; 5、有相关语音算法引擎开发经验的优先。
工作职责
ByteIntern:面向2026届毕业生(2025年9月-2026年8月期间毕业),为符合岗位要求的同学提供转正机会。 团队介绍:Data语音团队致力于语音/音频/音乐相关的AI核心技术研发和产品创新。部门支撑音频和多模态内容从生产、编辑到消费的全流程,赋能内容创作和互动,并以中台形式支持集团多个业务,提供业界前沿的技术能力与解决方案。 1、参与/研发业界领先、高效、易用的高性能大模型服务引擎框架,支撑大模型语音理解、语音合成、音乐生成以及端到端对话交互等场景核心能力落地; 2、参与/负责引擎深度优化,包括高性能计算引擎、语音理解/合成、音乐生成等常用引擎的极致优化; 3、参与/负责语音相关大模型(理解、合成、音乐、对话交互)能力工程化落地,支持抖音、剪映、豆包、猫箱、飞书,番茄小说、火山引擎等产品,用户规模数亿国内国际用户。
ByteIntern:面向2026届毕业生(2025年9月-2026年8月期间毕业),为符合岗位要求的同学提供转正机会。 团队介绍:Data语音团队致力于语音/音频/音乐相关的AI核心技术研发和产品创新。部门支撑音频和多模态内容从生产、编辑到消费的全流程,赋能内容创作和互动,并以中台形式支持集团多个业务,提供业界前沿的技术能力与解决方案。 1、参与/研发业界领先、高效、易用的高性能大模型服务引擎框架,支撑大模型语音理解、语音合成、音乐生成以及端到端对话交互等场景核心能力落地; 2、参与/负责引擎深度优化,包括高性能计算引擎、语音理解/合成、音乐生成等常用引擎的极致优化; 3、参与/负责语音相关大模型(理解、合成、音乐、对话交互)能力工程化落地,支持抖音、剪映、豆包、猫箱、飞书,番茄、火山引擎等产品,用户规模数亿国内国际用户。
ByteIntern:面向2026届毕业生(2025年9月-2026年8月期间毕业),为符合岗位要求的同学提供转正机会。 团队介绍:Data语音团队致力于语音/音频/音乐相关的AI核心技术研发和产品创新。部门支撑音频和多模态内容从生产、编辑到消费的全流程,赋能内容创作和互动,并以中台形式支持集团多个业务,提供业界前沿的技术能力与解决方案。 1、参与/研发业界领先、高效、易用的高性能大模型服务引擎框架,支撑大模型语音理解、语音合成、音乐生成以及端到端对话交互等场景核心能力落地; 2、参与/负责引擎深度优化,包括高性能计算引擎、语音理解/合成、音乐生成等常用引擎的极致优化; 3、参与/负责语音相关大模型(理解、合成、音乐、对话交互)能力工程化落地,支持抖音、剪映、豆包、猫箱、飞书,番茄、火山引擎等产品,用户规模数亿国内国际用户。
ByteIntern:面向2026届毕业生(2025年9月-2026年8月期间毕业),为符合岗位要求的同学提供转正机会。 团队介绍:Data语音团队致力于语音/音频/音乐相关的AI核心技术研发和产品创新。部门支撑音频和多模态内容从生产、编辑到消费的全流程,赋能内容创作和互动,并以中台形式支持集团多个业务,提供业界前沿的技术能力与解决方案。 1、参与/研发业界领先、高效、易用的高性能大模型服务引擎框架,支撑大模型语音理解、语音合成、音乐生成以及端到端对话交互等场景核心能力落地; 2、参与/负责引擎深度优化,包括高性能计算引擎、语音理解/合成、音乐生成等常用引擎的极致优化; 3、参与/负责语音相关大模型(理解、合成、音乐、对话交互)能力工程化落地,支持抖音、剪映、豆包、猫箱、飞书,番茄小说、火山引擎等产品,用户规模数亿国内国际用户。
ByteIntern:面向2026届毕业生(2025年9月-2026年8月期间毕业),为符合岗位要求的同学提供转正机会。 团队介绍:Data语音团队致力于语音/音频/音乐相关的AI核心技术研发和产品创新。部门支撑音频和多模态内容从生产、编辑到消费的全流程,赋能内容创作和互动,并以中台形式支持集团多个业务,提供业界前沿的技术能力与解决方案。 1、参与/研发业界领先、高效、易用的高性能大模型服务引擎框架,支撑大模型语音理解、语音合成、音乐生成以及端到端对话交互等场景核心能力落地; 2、参与/负责引擎深度优化,包括高性能计算引擎、语音理解/合成、音乐生成等常用引擎的极致优化; 3、参与/负责语音相关大模型(理解、合成、音乐、对话交互)能力工程化落地,支持抖音、剪映、豆包、猫箱、飞书,番茄小说、火山引擎等产品,用户规模数亿国内国际用户。