商汤语音算法工程师

社招全职算法研究2025-11-18地点：北京 | 深圳状态：招聘

扫码手机上打开

任职要求

1.人工智能、机器学习、信号处理或计算机科学等相关专业研究生以上学历，基础扎实
2.熟悉主流的语音识别模型算法，如RNN-T、conformer、CTC
3.熟悉kaldi / K2 / wenet / espnet / whisper / FunASR 中至少两种工具
4.学习研究能力强，能够独立阅读英文文献，对解决具有挑战性的问题充满激情
5.具有扎实的机器学习理论基础，优秀的算法实现能力，熟练使用 PyTorch 等深度学习框架，掌握SSL、LLM、diffusion、对比学习等机器学习技术在音频生成领域的应用；
6.具有…

登录查看完整任职要求

微信扫码，1秒登录

工作职责

1. 负责多模态语音交互场景下的语音理解、语音生成和语音交互大模型的算法研发、性能优化与落地实现；
2.负责数字人场景下的个性化实时情感对话语音合成、低资源音色克隆、语音识别、语音增强、语音检测、语种识别、声纹识别、说话人分割、变声、音乐生成等技术研发；
3.负责语音相关算法引擎的流式改造、推理优化、大并发低延迟云服务、私有化服务定制开发；
4.跟进学术界、行业最新的研究趋势，产出新的科研成果，并落地于实际产品。

📮 投递简历 ✨AI模拟面试

难度：

包括英文材料

机器学习+

学历+

语音识别+

算法+

RNN+

PyTorch+

深度学习+

大模型+

还有更多 •••

登录查看完整学习资料

相关职位

语音算法工程师

社招技术类

第四范式是中国智能决策市场的最大参与者。公司致力于实现企业级人工智能快速规模化落地，为企业提供以“决策型AI”、“生成式AI”为核心的技术、产品及解决方案，推动传统企业的数字化转型进程。2023年2月发布自研的多模态大模型产品“式说（4Paradigm SageGPT）”，已积累了数家国内最早的AIGC产业应用。目前已上市，有机会争取股票激励。•负责语音方向的设计和研发，模型的效果优化，包括不限于：参与语音识别、语音合成、声纹识别、语音评测等方向•将语音领域的算法应用于实际场景，解决真实业务问题•将实践中的创新点以Github Repo/Paper/Tech Report等形式开源

更新于 2023-02-27北京

语音算法工程师

社招4年以上研发类

1. 负责语音算法的研究与开发，主要包括语音识别（ASR）等方向； 2. 跟踪并落地业界前沿的语音算法与深度学习技术，持续优化模型的准确率、实时性与鲁棒性； 3. 针对实际业务场景（如手机终端、平板等）进行算法调优与工程化落地； 4. 参与算法数据的采集、清洗、标注规范制定，构建高质量训练数据集； 5. 与产品、工程团队紧密协作，推动算法在端侧/云端的部署与性能优化。

更新于 2026-07-14杭州

语音算法工程师

社招研发类

更新于 2026-07-30杭州

语音算法工程师

社招

1、熟悉声音转换、歌唱转换相关算法和技术； 2、熟悉语音合成、语音合成大模型等相关算法和技术； 3、熟悉常见的声学模型和声码器，具有相关的开发和研究经验； 4、搭建语音合成、语音转换、训练微调引擎工程化经验

更新于 2025-10-28北京