logo of bytedance

字节跳动语音引擎研发工程师-Data语音

校招全职A157360地点:北京状态:招聘

任职要求


1、2026届获得本科及以上学历,计算机等相关专业优先;
2、扎实的C++CPython编程语言,熟悉常用数据结构以及算法,对有挑战的工作富有热情;
3、熟悉计算机体系结构和操作系统,具备软件/库架构的设计与研发经验的更佳;
4、有较强的分析问题和解决问题的能力,有强烈的责任心。

加分项:
1、在ACM/NOI/IOI/TopCoder获奖者优先;
2、有量化、GPTQ、AWQ、蒸馏、投机采样、指令集优化、深度模型优化等相关项目经验者优先;
3、有CPU/GPU/NPU、CUDA、Cutlass、Triton、TileLang、OpenCL、ARM、DSP等高性能计算优化经验者优先;
4、有大模型推理框架vLLMSglang等相关大模型引擎开发经验的优先;
5、有语音信号处理、语音识别、语音合成或者自然语言处理算法相关经验的优先。

工作职责


团队介绍:Data语音团队致力于语音/音频/音乐相关的AI核心技术研发和产品创新。部门支撑音频和多模态内容从生产、编辑到消费的全流程,赋能内容创作和互动,并以中台形式支持集团多个业务,提供业界前沿的技术能力与解决方案。

1、负责大模型推理框架与引擎建设,提供满足音频各场景的核心原子能力;
2、负责大模型推理框架与引擎深度优化,包括语音信号处理、交互、翻译、理解、生成、音乐等大模型推理性能极致优化,支持相关大模型业务落地;
3、负责语音大模型模型压缩(如蒸馏、量化、投机采样等)技术业务迭代与落地;
4、负责为字节跳动全系产品(豆包、抖音、剪映、番茄小说、飞书、火山引擎等)提供AI语音理解、对话以及合成等方面的能力,用AI技术影响数亿国内国际用户。
包括英文材料
学历+
C+++
C+
Python+
数据结构+
算法+
CUDA+
OpenCL+
大模型+
vLLM+
SGLang+
语音识别+
NLP+
相关职位

logo of bytedance
社招A221731

1、设计和研发业界领先的高性能端云算法引擎,提供满足语音识别,对话交互,语音合成,音频检索等场景的核心原子能力; 2、负责深度优化核心引擎,包括端云一体的高性能计算引擎,音频特征处理引擎,大规模解码引擎,音频合成引擎,音频特效引擎,对话交互引擎,音频检索引擎等常用引擎极致优化; 3、负责算法落地性能评估和分析,制定技术规划和性能标准,持续加强提升关键技术竞争力; 4、负责为字节跳动产品(今日头条、抖音、抖音火山版、西瓜视频、飞书、番茄小说等)提供AI语音理解、对话以及语音合成等方面的能力,用AI技术影响数亿用户。

更新于 2025-05-27
logo of bytedance
社招A11226

1、设计和研发业界领先的高性能端云算法引擎,提供满足语音识别,对话交互,语音合成,音频检索等场景的核心原子能力; 2、负责深度优化核心引擎,包括端云一体的高性能计算引擎,音频特征处理引擎,大规模解码引擎,音频合成引擎,音频特效引擎,对话交互引擎,音频检索引擎等常用引擎极致优化; 3、负责算法落地性能评估和分析,制定技术规划和性能标准,持续加强提升关键技术竞争力; 4、负责为字节跳动全系产品(今日头条、抖音、抖音火山版、西瓜视频、飞书、番茄小说等)提供AI语音理解、对话以及语音合成等方面的能力,用AI技术影响数亿用户。

更新于 2025-03-28
logo of bytedance
社招3年以上A147138

1、持续推进豆包语音大模型最新技术的工程优化和应用落地; 2、负责设计并实现高可用、可扩展、分布式机器学习平台,支撑多地域语音相关业务模型服务高效迭代更新; 3、与算法、引擎、后端工程师密切配合,理解语音大模型MaaS能力建设和部署运维流程,负责/参与机器学习平台的设计、开发和维护; 4、持续提升平台效率、易用性、降低使用成本,探索业界前沿的机器学习相关技术,设计并实现到机器学习平台。

更新于 2025-03-28
logo of bytedance
社招3年以上A30891

1、持续推进豆包语音大模型最新技术的工程优化和应用落地; 2、负责设计并实现高可用、可扩展、分布式机器学习平台,支撑多地域语音相关业务模型服务高效迭代更新; 3、与算法、引擎、后端工程师密切配合,理解语音大模型MaaS能力建设和部署运维流程,负责/参与机器学习平台的设计、开发和维护; 4、持续提升平台效率、易用性、降低使用成本,探索业界前沿的机器学习相关技术,设计并实现到机器学习平台。

更新于 2025-03-28