智能互联通义实验室-语音识别/语音大模型算法专家-通义百聆

社招全职3年以上技术类-算法2026-04-02地点：北京 | 杭州状态：招聘

扫码手机上打开

任职要求

1. 计算机科学、信号处理、语音处理、人工智能等相关领域硕士及以上学历。
2. 2年以上音频AI研发经验，包括但不限于 音频识别及理解、音频生成、数字人、多模态交互 等方向。
3. 扎实的深度学习基础，熟练掌握PyTorch/TensorFlow等框架。
4. 优秀的编程能力（Pyt…

登录查看完整任职要求

微信扫码，1秒登录

工作职责

1. 主导多模态理解/音频大模型的前沿算法研究及产业落地。
2. 音频理解方向：
（1）研发语音识别、语音翻译以及音频分析等理解算法。
（2）开发跨模态（语音/文本/视觉）的音频语义理解系统。
（3）探索音频大模型架构设计。
（4）推动算法成果转化：通过ModelScope开源社区创造研究价值，或通过阿里云产品体系创造商业价值。
（5）持续跟踪国际前沿技术动态（ICASSP/Interspeech/NeurIPS/ICLR等），参与国际会议、研讨会，与全球顶级团队进行交流合作。

📮 投递简历 ✨AI模拟面试

难度：

包括英文材料

学历+

数字人+

深度学习+

PyTorch+

还有更多 •••

登录查看完整学习资料

相关职位

通义实验室-语音识别/语音大模型算法专家-通义百聆

社招3年以上技术类-算法

1. 主导多模态理解/音频大模型的前沿算法研究及产业落地。 2. 音频理解方向：（1）研发语音识别、语音翻译以及音频分析等理解算法。（2）开发跨模态（语音/文本/视觉）的音频语义理解系统。（3）探索音频大模型架构设计。（4）推动算法成果转化：通过ModelScope开源社区创造研究价值，或通过阿里云产品体系创造商业价值。（5）持续跟踪国际前沿技术动态（ICASSP/Interspeech/NeurIPS/ICLR等），参与国际会议、研讨会，与全球顶级团队进行交流合作。

更新于 2026-06-04北京|杭州

通义实验室-语音识别算法专家-北京/杭州

社招2年以上技术类-算法

1. 负责语音识别和语音对话大模型的算法研发与优化，包括声学模型、LLM模型和解码器等，探索新的算法架构，建设高效率、低时延的语音应用系统。 2. 结合业务需求，持续改进现有模型的性能，确保其在不同应用场景下的准确性和鲁棒性，提升语音助手和语音智能体用户体验。 3. 构建和管理大规模语音识别和语音对话语料库，用于训练、验证和测试模型。 4. 跟踪前沿技术和研究动态，提出新颖的算法思路和解决方案。

更新于 2026-01-19北京|杭州

通义实验室-语音大模型算法专家/高级专家-多模态交互

社招3年以上技术类-算法

1. 负责语音合成、语音识别、端到端语音交互大模型算法的基础研究和应用落地。 2. 参与语音合成与识别技术在业务场景落地，解决落地过程中的前沿问题，持续优化语音合成与识别核心技术效果。 3. 深入调研和关注音频/NLP/多模态/全模态等方向的前沿技术，持续探索语音技术的新能力和新应用。

更新于 2026-02-11北京|杭州

通义实验室-语音处理算法专家-通义百聆

社招3年以上技术类-算法

1. 负责通义实验室语音团队的语音处理算法研发，通过深入理解全链路技术挑战和推动语音前后端协作，不限于语音增强、回声消除、麦克风阵列（波束形成、声源定位等）、语音唤醒、多模检测、轻量化ASR/TTS/LLM等任务，打造行业领先的语音处理算法。 2. 持续关注行业前沿动态，通过专利申请、论文和技术报告等形式提升团队的技术影响力。

更新于 2025-12-05北京|杭州