logo of kuaishou

快手语音识别算法工程师

社招全职D2861地点:北京状态:招聘

任职要求


1、熟悉自监督SSL训练方法和流程,包括Hubert、BESR-RQ等模型训练和调优经验;
2、熟练掌握C/C++Python有较强的工程实现能力;
3、熟悉Kaldi/K2/WeNet/espnet等工具库,有RNN-T、LAS、CTC等调优经验;
4、相关顶会或期刊上发表论文者优先(ICASSP,Interspeech,ACL,ICML等);
5、有团队精神,良好的表达能力和沟通能力,有大型项目经验者优先。

工作职责


1、负责语音识别整体流程,包括数据挖掘、数据清洗、声学模型训练;
2、负责语音识别模型优化和调优,包括语音端点检测优化、声学模型优化、解码方法优化等;
3、负责跟进行业前沿技术发展趋势,跟踪国际最新技术发展方向;
4、探索语音/音频/音乐技术落地新玩法,在音频AI理解和生成等方向进行业务创新。
包括英文材料
C+
C+++
Python+
ICML+
相关职位

logo of tencent
社招3年以上元宝技术

1.优化大规模商用语音识别系统,提高系统的鲁棒性和性能; 2.负责声学前端、声学模型、语言模型、后处理、解码器等主要模块的迭代和改进; 3.追踪业界前沿的语音技术,探索语音大模型在业务场景下的应用。

更新于 2025-08-02
logo of tencent
社招CSIG技术

1.优化大规模商用语音识别系统,提高系统的鲁棒性和性能; 2.负责声学前端、声学模型、语言模型、后处理、解码器等主要模块的迭代和改进; 3.追踪业界前沿的语音技术,探索语音大模型在业务场景下的应用。

更新于 2025-04-24
logo of bytedance
社招JR6DP

1、支持语音识别技术在字节跳动公司内外丰富的业务场景落地,解决落地过程中的前沿问题,持续优化语音识别核心技术效果; 2、搭建音频理解核心技术体系,专注语音识别的前沿技术和算法效果,追求和探索业界最前沿算法。

更新于 2021-03-29
logo of bytedance
社招X1570

团队介绍:字节跳动 Seed 团队成立于 2023 年,致力于寻找通用智能的新方法,追求智能上限。团队研究方向涵盖 LLM、语音、视觉、世界模型、基础架构、AI Infra、下一代 AI 交互等,在中国、新加坡、美国等地设有实验室和岗位。 Seed 团队在 AI 领域拥有长期愿景与决心,坚持深耕基础,期望成为世界一流的 AI 研究团队,为科技和社会发展作出贡献。目前团队已推出业界领先的通用大模型以及前沿的多模态能力,支持豆包、扣子、即梦等超过 50 个应用场景。 1、参与研发多模态模型等下一代人工智能核心技术; 2、关注和推进技术在业务场景中的广泛应用,包括但不限于语言、音乐、语音、音频的生成与理解等; 3、深入调研和关注音频/NLP/多模态等方向的前沿技术。

更新于 2022-06-30