快手语音识别算法工程师
社招全职D2861地点:北京状态:招聘
任职要求
1、熟悉自监督SSL训练方法和流程,包括Hubert、BESR-RQ等模型训练和调优经验; 2、熟练掌握C/C++、Python有较强的工程实现能力; 3、熟悉Kaldi/K2/WeNet/espnet等工具库,有RNN-T、LAS、CTC等调优经验; 4、相关顶会或期刊上发表论文者优先(ICASSP,Interspeech,ACL,ICML等); 5、有团队精神,良好的表达能力和沟通能力,有大型项目经验者优先。
工作职责
1、负责语音识别整体流程,包括数据挖掘、数据清洗、声学模型训练; 2、负责语音识别模型优化和调优,包括语音端点检测优化、声学模型优化、解码方法优化等; 3、负责跟进行业前沿技术发展趋势,跟踪国际最新技术发展方向; 4、探索语音/音频/音乐技术落地新玩法,在音频AI理解和生成等方向进行业务创新。
包括英文材料
C+
https://www.freecodecamp.org/chinese/news/the-c-beginners-handbook/
本手册遵循二八定律。你将在 20% 的时间内学习 80% 的 C 编程语言。
https://www.youtube.com/watch?v=87SH2Cn0s9A
https://www.youtube.com/watch?v=KJgsSFOSQv0
This course will give you a full introduction into all of the core concepts in the C programming language.
https://www.youtube.com/watch?v=PaPN51Mm5qQ
In this complete C programming course, Dr. Charles Severance (aka Dr. Chuck) will help you understand computer architecture and low-level programming with the help of the classic C Programming language book written by Brian Kernighan and Dennis Ritchie.
C+++
https://www.learncpp.com/
LearnCpp.com is a free website devoted to teaching you how to program in modern C++.
https://www.youtube.com/watch?v=ZzaPdXTrSb8
Python+
https://liaoxuefeng.com/books/python/introduction/index.html
中文,免费,零起点,完整示例,基于最新的Python 3版本。
https://www.learnpython.org/
a free interactive Python tutorial for people who want to learn Python, fast.
https://www.youtube.com/watch?v=K5KVEU3aaeQ
Master Python from scratch 🚀 No fluff—just clear, practical coding skills to kickstart your journey!
https://www.youtube.com/watch?v=rfscVS0vtbw
This course will give you a full introduction into all of the core concepts in python.
ICML+
https://icml.cc/
相关职位
社招3年以上元宝技术
1.优化大规模商用语音识别系统,提高系统的鲁棒性和性能; 2.负责声学前端、声学模型、语言模型、后处理、解码器等主要模块的迭代和改进; 3.追踪业界前沿的语音技术,探索语音大模型在业务场景下的应用。
更新于 2025-08-02
社招CSIG技术
1.优化大规模商用语音识别系统,提高系统的鲁棒性和性能; 2.负责声学前端、声学模型、语言模型、后处理、解码器等主要模块的迭代和改进; 3.追踪业界前沿的语音技术,探索语音大模型在业务场景下的应用。
更新于 2025-04-24
社招JR6DP
1、支持语音识别技术在字节跳动公司内外丰富的业务场景落地,解决落地过程中的前沿问题,持续优化语音识别核心技术效果; 2、搭建音频理解核心技术体系,专注语音识别的前沿技术和算法效果,追求和探索业界最前沿算法。
更新于 2021-03-29
社招X1570
团队介绍:字节跳动 Seed 团队成立于 2023 年,致力于寻找通用智能的新方法,追求智能上限。团队研究方向涵盖 LLM、语音、视觉、世界模型、基础架构、AI Infra、下一代 AI 交互等,在中国、新加坡、美国等地设有实验室和岗位。 Seed 团队在 AI 领域拥有长期愿景与决心,坚持深耕基础,期望成为世界一流的 AI 研究团队,为科技和社会发展作出贡献。目前团队已推出业界领先的通用大模型以及前沿的多模态能力,支持豆包、扣子、即梦等超过 50 个应用场景。 1、参与研发多模态模型等下一代人工智能核心技术; 2、关注和推进技术在业务场景中的广泛应用,包括但不限于语言、音乐、语音、音频的生成与理解等; 3、深入调研和关注音频/NLP/多模态等方向的前沿技术。
更新于 2022-06-30