logo of bytedance

字节跳动智能音频算法工程师

社招全职A114480地点:北京状态:招聘

任职要求


1、丰富的数字信号处理和人工智能/深度学习系统研发经验:在3D空间音频渲染,降噪/回声/去混响等音频前处理,声纹/唤醒,声音事件检测,语音识别自然语言处理等一个或几个领域有项目实践;
2、熟悉数据结构算法,深度网络模型设计和调优,熟练掌握Kaldi,TensorFlowPytorch等开源工具,有大规模训练数据集上进行模型训练和探索经验尤佳;
3、良好的团队合作意识和学习能力,有业务意识,对语音和音频领域技术有热情;
4、在相关国际会议或主流期刊上发表论文者优先(ICASSP,Interspeech,ASRU)。

工作职责


1、负责字节跳动旗下音频内容消费业务场景的智能音频理解和处理算法研发和业务支持,业务包括但不限于抖音,西瓜视频,直播,剪映等;
2、搭建智能音频理解和处理的系统级解决方案,为字节跳动智能音频ToB提供技术火力;
3、跟踪智能音频领域的最新技术进展并升级团队自研的各算法系统,包括3D空间渲染,音频质量提升系统,音频事件检测系统,音频理解系统等;
4、跟进产品业务的音频需求,持续改进产品的音频质量体验;
5、跟踪研发业界先进的音频进展,统计模型/机器学习/深度学习技术在语音/音频领域研发并落地产品。
包括英文材料
深度学习+
语音识别+
NLP+
数据结构+
算法+
TensorFlow+
PyTorch+
相关职位

logo of bytedance
社招A99152

1、负责字节跳动旗下音频内容消费业务场景的智能音频理解和处理算法研发和业务支持,业务包括但不限于抖音,西瓜视频,直播,剪映等; 2、搭建智能音频理解和处理的系统级解决方案,为字节跳动智能音频ToB提供技术火力; 3、跟踪智能音频领域的最新技术进展并升级团队自研的各算法系统,包括3D空间渲染,音频质量提升系统,音频事件检测系统,音频理解系统等; 4、跟进产品业务的音频需求,持续改进产品的音频质量体验; 5、跟踪研发业界先进的音频进展,统计模型/机器学习/深度学习技术在语音/音频领域研发并落地产品。

更新于 2025-01-21
logo of bytedance
社招A73988A

1、负责字节跳动旗下音频内容消费业务场景的智能音频理解和处理算法研发和业务支持,业务包括但不限于抖音,西瓜视频,直播,剪映等; 2、搭建智能音频理解和处理的系统级解决方案,为字节跳动智能音频ToB提供技术支持; 3、跟踪智能音频领域的最新技术进展并升级团队自研的各算法系统,包括3D空间渲染,音频质量提升系统,音频事件检测系统,音频理解系统等; 3、跟进产品业务的音频需求,持续改进产品的音频质量体验; 4、跟踪研发业界先进的音频进展,统计模型/机器学习/深度学习技术在语音/音频领域研发并落地产品。

更新于 2025-01-21
logo of bytedance
社招A217930

1、负责为抖音客服业务VOIP和热线等语音交互场景提供专业的音频技术支持与研发,运用端到端的语音大模型实现更高效、智能的客服音频交互体验; 2、负责端到端语音大模型在客服应用中的落地与优化,搭建智能音频理解和处理在客服领域的系统级解决方案; 3、跟进客服产品业务的语音/音频需求,持续改进产品的音频质量体验;结合实际业务场景,对模型进行针对性训练和调优,确保语音识别、合成等功能能精准适配客服对话需求,提升对话理解和回复的准确性; 4、跟踪研发业界先进的音频进展,探索语音/音频领域最新技术的研发并落地产品。

更新于 2025-03-11
logo of bytedance
社招A57052A

1、负责为抖音客服业务VOIP和热线等语音交互场景提供专业的音频技术支持与研发,运用端到端的语音大模型实现更高效、智能的客服音频交互体验; 2、负责端到端语音大模型在客服应用中的落地与优化,搭建智能音频理解和处理在客服领域的系统级解决方案; 3、跟进客服产品业务的语音/音频需求,持续改进产品的音频质量体验;结合实际业务场景,对模型进行针对性训练和调优,确保语音识别、合成等功能能精准适配客服对话需求,提升对话理解和回复的准确性; 4、跟踪研发业界先进的音频进展,探索语音/音频领域最新技术的研发并落地产品。

更新于 2025-03-11