logo of sensetime

商汤语音算法工程师

社招全职算法研究地点:北京 | 深圳状态:招聘

任职要求


1.人工智能、机器学习、信号处理或计算机科学等相关专业研究生以上学历,基础扎实
2.熟悉主流的语音识别模型算法,如RNN-T、conformer、CTC
3.熟悉kaldi / K2 / wenet / espnet / whisper / FunASR 中至少两种工具
4.学习研究能力强,能够独立阅读英文文献,对解决具有挑战性的问题充满激情
5.具有扎实的机器学习理论基础,优秀的算法实现能力,熟练使用 PyTorch深度学习框架,掌握SSL、LLM、diffusion、对比学习等机器学习技术在音频生成领域的应用;
6.具有…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1. 负责多模态语音交互场景下的语音理解、语音生成和语音交互大模型的算法研发、性能优化与落地实现;
2.负责数字人场景下的个性化实时情感对话语音合成、低资源音色克隆、语音识别、语音增强、语音检测、语种识别、声纹识别、说话人分割、变声、音乐生成等技术研发;
3.负责语音相关算法引擎的流式改造、推理优化、大并发低延迟云服务、私有化服务定制开发;
4.跟进学术界、行业最新的研究趋势,产出新的科研成果,并落地于实际产品。
包括英文材料
机器学习+
学历+
语音识别+
算法+
RNN+
PyTorch+
深度学习+
大模型+
还有更多 •••
相关职位

logo of oppo
校招AI/算法类

1. 参与大模型端到端的语音技术研发。 2. 参与语音技术前沿问题的探索与研究,结合实际应用场景,实现可落地语音技术解决方案。

更新于 2025-07-14北京
logo of soul
社招

岗位职责 1. 负责语音合成、语音克隆、双工语音通话等语音生成相关技术的数据和模型开发,并协助业务落地; 2. 负责持续跟进业界前沿算法发展方向,支持公司在核心技术上的影响力发展。

更新于 2024-12-09北京
logo of honor
校招研发类

1、负责参与语音算法能力构建,包括不限于语音识别、声学模型、语言模型、热词技术、语音合成、音频鉴伪等; 2、负责语音领域算法压缩量化、推理加速、小型化部署; 3、跟踪语音算法领域的前沿技术规划,参与核心算法与系统方案在业务的落地。

更新于 2025-08-08北京
logo of insta360
社招3年以上

1、负责基于传统/AI方案的AEC、语音降噪、阵列算法等音频信号处理算法的研发; 2、负责算法在具体业务场景、项目上的验证、优化和落地工作, 将其部署于端侧平台; 3、跟进行业技术趋势和行业动态,研究新兴技术,保持团队技术领先性。

更新于 2024-10-08深圳