通义通义实验室-语音识别/语音大模型算法专家-通义百聆

社招全职3年以上技术类-算法2026-06-04地点：北京 | 杭州状态：招聘

扫码手机上打开

任职要求

1. 计算机科学、信号处理、语音处理、人工智能等相关领域硕士及以上学历。
2. 2年以上音频AI研发经验，包括但不限于 音频识别及理解、音频生成、数字人、多模态交互 等方向。
3. 扎实的深度学习基础，熟练掌握PyTorch/TensorFlow等框架。
4. 优秀的编程能力（Pyt…

登录查看完整任职要求

微信扫码，1秒登录

工作职责

1. 主导多模态理解/音频大模型的前沿算法研究及产业落地。
2. 音频理解方向：
（1）研发语音识别、语音翻译以及音频分析等理解算法。
（2）开发跨模态（语音/文本/视觉）的音频语义理解系统。
（3）探索音频大模型架构设计。
（4）推动算法成果转化：通过ModelScope开源社区创造研究价值，或通过阿里云产品体系创造商业价值。
（5）持续跟踪国际前沿技术动态（ICASSP/Interspeech/NeurIPS/ICLR等），参与国际会议、研讨会，与全球顶级团队进行交流合作。

📮 投递简历 ✨AI模拟面试

难度：

包括英文材料

学历+

数字人+

深度学习+

PyTorch+

还有更多 •••

登录查看完整学习资料

相关职位

通义实验室-语音识别/语音大模型算法专家-通义百聆

社招3年以上技术类-算法

1. 主导多模态理解/音频大模型的前沿算法研究及产业落地。 2. 音频理解方向：（1）研发语音识别、语音翻译以及音频分析等理解算法。（2）开发跨模态（语音/文本/视觉）的音频语义理解系统。（3）探索音频大模型架构设计。（4）推动算法成果转化：通过ModelScope开源社区创造研究价值，或通过阿里云产品体系创造商业价值。（5）持续跟踪国际前沿技术动态（ICASSP/Interspeech/NeurIPS/ICLR等），参与国际会议、研讨会，与全球顶级团队进行交流合作。

更新于 2026-04-02北京|杭州

微信输入法- 语音识别大模型算法研究员/工程师

社招3年以上微信输入法技术

1.负责语音识别大模型研发，提高噪声/小声/远场/口音/方言等复杂声学条件下识别鲁棒性； 2.负责语音识别语音-文本多模态大模型的研发，融合领域知识，用户行为与实时信息，提高大模型的上下文建模与逻辑推理能力； 3.负责语音识别大模型预训练，后训练、强化学习相关的数据和算法工作。

更新于 2026-07-10北京

大模型语音识别算法工程师

社招3-5年多媒体算法

1.支持语音识别及音频理解在小红书丰富业务场景的落地，持续优化大模型语音识别效果 2.跟进最领先的音频理解技术体系，包括但不限于提出新的音频理解技术框架、改进现有的算法、持续提升相关技术及业务指标，鼓励撰写论文及申请专利。

更新于 2026-07-16北京|上海

微信输入法-语音识别大模型研究

校招青云计划-实习生

北京