通义通义实验室-语音识别算法专家-北京/杭州

社招全职2年以上技术类-算法2026-01-19地点：北京 | 杭州状态：招聘

扫码手机上打开

任职要求

1. 计算机科学、人工智能或相关领域的硕士或博士学位，3年以上专注于语音识别、机器学习或深度学习的实际工作经验，具备语音大模型研发经验者优先。
2. 熟练掌握pytorch、tensorfl…

登录查看完整任职要求

微信扫码，1秒登录

工作职责

1. 负责语音识别和语音对话大模型的算法研发与优化，包括声学模型、LLM模型和解码器等，探索新的算法架构，建设高效率、低时延的语音应用系统。
2. 结合业务需求，持续改进现有模型的性能，确保其在不同应用场景下的准确性和鲁棒性，提升语音助手和语音智能体用户体验。
3. 构建和管理大规模语音识别和语音对话语料库，用于训练、验证和测试模型。
4. 跟踪前沿技术和研究动态，提出新颖的算法思路和解决方案。

📮 投递简历 ✨AI模拟面试

难度：

包括英文材料

学历+

语音识别+

机器学习+

深度学习+

大模型+

还有更多 •••

登录查看完整学习资料

相关职位

千问C端事业群-语音识别算法专家-杭州/北京

社招1年以上技术类-算法

1.负责声学前端、声学模型、语言模型、后处理、解码器等主要模块的迭代和改进； 2.负责优化双工交互系统，提高系统的鲁棒性和性能； 3.负责优化语音识别大模型、流式语音识别、音频理解大模型、语音端到端大模型等； 4.追踪业界前沿的语音技术，探索语音大模型在业务场景下的应用。

更新于 2025-12-22北京|杭州

饿了么-语音识别算法专家-北京

社招4年以上技术类-算法

1. 负责语音识别相关算法的研发与优化，包括唤醒词模型、ASR（自动语音识别）系统的性能提升； 2. 参与外呼场景中的语音交互系统建设，提升语音识别在复杂环境下的鲁棒性和准确率； 3. 结合大模型技术，探索语音识别与生成式AI的融合应用； 4. 研究并落地RAG（检索增强生成）技术在语音语义理解中的应用； 5. 探索基于Agent技术的智能语音交互架构，构建端到端的语音智能解决方案。

更新于 2025-10-16北京

语音算法专家（语音识别方向）

社招5年以上研发类

1、语音识别技术研发：设计并优化语音识别模型（如基于 CTC/Transformer/RNNT 的端到端模型），解决噪声环境（如会议室回声、背景杂音）、方言 / 口音、特定领域术语（如专业行业词汇）的识别难题，提升识别准确率与响应速度； 2、角色分离技术突破：研发多说话人角色分离算法，实现语音流中不同说话人的精准分割与身份关联（Speaker Diarization），解决重叠语音、短语音片段、说话人特征相似等场景下的分离问题，输出结构化的角色 - 语音对应数据； 3、技术工程化与迭代：与产品、工程团队协作，将算法模型部署到实际业务系统（如云端 API、客户端 SDK），解决模型压缩、推理加速、资源占用优化等问题；持续跟踪业务数据，迭代优化模型性能，处理线上技术故障； 4、技术调研与创新：关注语音技术领域前沿动态（如 ICASSP、INTERSPEECH 顶会成果），调研行业先进方案，推动新技术（如多模态语音处理、低资源语种适配）在业务中的试点与应用。

更新于 2025-11-24杭州

通义实验室-语音识别/语音大模型算法专家-通义百聆

社招3年以上技术类-算法

1. 主导多模态理解/音频大模型的前沿算法研究及产业落地。 2. 音频理解方向：（1）研发语音识别、语音翻译以及音频分析等理解算法。（2）开发跨模态（语音/文本/视觉）的音频语义理解系统。（3）探索音频大模型架构设计。（4）推动算法成果转化：通过ModelScope开源社区创造研究价值，或通过阿里云产品体系创造商业价值。（5）持续跟踪国际前沿技术动态（ICASSP/Interspeech/NeurIPS/ICLR等），参与国际会议、研讨会，与全球顶级团队进行交流合作。

更新于 2026-04-02北京|杭州