高德地图高德-语音算法专家-ASR & 语音表征学习方向

社招全职3年以上技术类-算法2025-11-20地点：北京状态：招聘

扫码手机上打开

任职要求

必备条件：
计算机科学、人工智能、信号处理、通信工程等相关专业硕士及以上学历
3年以上语音识别（ASR）系统开发经验，熟悉主流ASR模型（如Paraformer、whisper等），熟悉基于自监督表征的识别方法。
具有特定领域ASR优化经验（如车载、电话客服、会议等），对噪声抑制、声源定…

登录查看完整任职要求

微信扫码，1秒登录

工作职责

团队介绍：
高德语音技术部，是负责高德自研全栈语音技术的综合性团队。团队核心技术能力包括：自研TTS基座大模型、端侧模型、多语种、RTC流式语音、语音识别、模型服务与推理、大规模语音IP定制服务等。业务支撑面向高德全部核心场景，包括语音导航、AI领航员、IP语音定制、国际化、AI语音助手、智能外呼、内容生成等。
团队定位是通过前沿语音技术的研究和落地，赋能下一代AI产品创新。近期部分技术（https://arxiv.org/abs/2507.12197）和产品进展介绍（https://mp.weixin.qq.com/s/A3TWtfwlqGdkC6oNHrkFaw ）

工作职责：
1、ASR系统搭建与优化：
主导出行场景的语音识别系统设计与实现，满足高噪声、多语种、方言等复杂场景下的语音识别需求；
针对出行场景的特殊性（如驾驶环境噪音、多用户交互等），优化提升识别准确率和实时性；
构建高可用的ASR服务框架，支持大规模数据训练、模型迭代及线上服务部署；
2、语音自监督表征与token化：
参与探索基于自监督学习（如Wav2Vec 2.0、HuBERT等）的语音表征方法，设计轻量化、高效的声学特征提取模型；
参与研究端到端语音语言模型（SpeechLM），推动语音对话系统向端到端方向演进；
3、跨部门协作与产品化：
与产品、工程团队协作，将研究成果转化为可落地的ASR解决方案。参与技术文档编写、算法效果评估及A/B测试，持续优化系统性能。

📮 投递简历 ✨AI模拟面试

难度：

包括英文材料

学历+

语音识别+

深度学习+

还有更多 •••

登录查看完整学习资料

相关职位

语音算法专家（语音大模型方向）

社招3年以上算法

1、基于语音大模型，研发与优化语音识别（ASR）和说话人识别相关算法； 2、支持中文（大陆 / 港澳台）、英文等多语种语音处理； 3、提升模型在噪声、口音、长音频等复杂场景下的效果与稳定性； 4、推动语音模型的工程化落地与线上部署。

更新于 2026-01-20北京

蚂蚁集团-语音交互算法专家-杭州

社招3年以上技术类-算法

1、负责语音tokenizer，ASR，TTS、端到端对话等算法及新技术方案的研发，推进语音新技术的突破； 2、负责可控语音生成、语音对话、情感理解及交互等场景的算法方案设计和研发，同时负责推进整体方案的落地； 3、负责在大模型技术栈下，新业务场景、新交互形态、新算法应用的调研和探索。

更新于 2025-12-23杭州

蚂蚁集团-语音算法专家/高级专家-杭州【AI Force】

社招5年以上技术类-算法

1、负责端侧语音交互模型（语音+语义双工）算法研发、协同工程团队落地和性能优化。 2、负责AI产品的语音识别、语音合成算法的应用和落地，提升识别准确率语与语音合成流畅度，及根据业务场景调优音色和综合的用户体验。 3、跟踪前沿语音AI技术和大语言模型在语音领域的结合应用，跟踪业界端到端的语音大模型能力，评估适配方案并推动技术落地。 4、与产品、后端研发团队协作，推动语音AI技术的快速迭代和业务落地。

更新于 2025-09-12杭州

高德-高级语音算法专家-前沿方向

社招3年以上技术类-算法

团队介绍：高德语音技术部，是负责高德自研全栈语音技术的综合性团队。团队核心技术能力包括：自研TTS基座大模型、端侧模型、多语种、RTC流式语音、语音识别、模型服务与推理、大规模语音IP定制服务等。业务支撑面向高德全部核心场景，包括语音导航、AI领航员、IP语音定制、国际化、AI语音助手、智能外呼、内容生成等。团队定位是通过前沿语音技术的研究和落地，赋能下一代AI产品创新。近期部分技术（https://arxiv.org/abs/2507.12197）和产品进展介绍（https://mp.weixin.qq.com/s/A3TWtfwlqGdkC6oNHrkFaw ）工作职责 1、参与输出语音技术（TTS、ASR、语音表征学习、端到端模型）的长期技术路线规划，推动团队在生成式语音大模型、多模态语音交互等领域的技术突破； 2、研究TTS大模型、端到端语音模型的前沿方向，探索语音与文本、视觉的跨模态融合，探索出行场景语音Agent的创新方向； 3、技术落地与产品化：将研究成果转化为高价值产品，解决复杂场景（如低资源语言、多语种、实时性要求高的工业级应用）； 4、学术与产业影响力：发表顶会论文（如ICASSP、INTERSPEECH、NeurIPS、ICML）、申请核心专利，提升公司技术话语权。

更新于 2025-09-16北京