logo of tencent

腾讯语音识别算法工程师

社招全职3年以上元宝技术地点:北京状态:招聘

任职要求


1.岗位要求;
2.计算机科学、电子工程、数学或相关领域的硕士及以上学位;
3.深入理解语音识别相关领域的基本概念,包括但不限于语音信号处理、自然语言处理机器学习深度学习等;
4.熟练掌握C++/C/Python/Shell等编程能力,并有实际的项目开发经验;
5.具有使用深度学习框架(如TensorFlowPyTorch等)进行算法开发的经验;
6.具有较强的学习能力,能够快速掌握和应用新技术;
7.具备良好的团队合作精神和沟通能力;
8.有在顶级会议或期刊发表论文者优先;
9.有语音大模型研发经验的优先。

工作职责


1.优化大规模商用语音识别系统,提高系统的鲁棒性和性能;
2.负责声学前端、声学模型、语言模型、后处理、解码器等主要模块的迭代和改进;
3.追踪业界前沿的语音技术,探索语音大模型在业务场景下的应用。
包括英文材料
学历+
语音识别+
NLP+
机器学习+
深度学习+
C+++
C+
Python+
Bash+
TensorFlow+
PyTorch+
算法+
大模型+
相关职位

logo of kuaishou
社招D2861

1、负责语音识别整体流程,包括数据挖掘、数据清洗、声学模型训练; 2、负责语音识别模型优化和调优,包括语音端点检测优化、声学模型优化、解码方法优化等; 3、负责跟进行业前沿技术发展趋势,跟踪国际最新技术发展方向; 4、探索语音/音频/音乐技术落地新玩法,在音频AI理解和生成等方向进行业务创新。

更新于 2025-07-10
logo of tencent
社招CSIG技术

1.优化大规模商用语音识别系统,提高系统的鲁棒性和性能; 2.负责声学前端、声学模型、语言模型、后处理、解码器等主要模块的迭代和改进; 3.追踪业界前沿的语音技术,探索语音大模型在业务场景下的应用。

更新于 2025-04-24
logo of bytedance
社招JR6DP

1、支持语音识别技术在字节跳动公司内外丰富的业务场景落地,解决落地过程中的前沿问题,持续优化语音识别核心技术效果; 2、搭建音频理解核心技术体系,专注语音识别的前沿技术和算法效果,追求和探索业界最前沿算法。

更新于 2021-03-29
logo of bytedance
社招X1570

团队介绍:字节跳动 Seed 团队成立于 2023 年,致力于寻找通用智能的新方法,追求智能上限。团队研究方向涵盖 LLM、语音、视觉、世界模型、基础架构、AI Infra、下一代 AI 交互等,在中国、新加坡、美国等地设有实验室和岗位。 Seed 团队在 AI 领域拥有长期愿景与决心,坚持深耕基础,期望成为世界一流的 AI 研究团队,为科技和社会发展作出贡献。目前团队已推出业界领先的通用大模型以及前沿的多模态能力,支持豆包、扣子、即梦等超过 50 个应用场景。 1、参与研发多模态模型等下一代人工智能核心技术; 2、关注和推进技术在业务场景中的广泛应用,包括但不限于语言、音乐、语音、音频的生成与理解等; 3、深入调研和关注音频/NLP/多模态等方向的前沿技术。

更新于 2022-06-30