logo of amap

高德地图高德-语音算法工程师-理解方向

社招全职3年以上技术类-算法地点:北京状态:招聘

任职要求


1、计算机、人工智能、信息、自动化等相关专业本科或研究生,有语音、自然语言处理机器学习、多模态等背景;
2、熟练掌握至少一种主流深度学习框架(PyTorch/TensorFlow),具备实际模型开发与训练经验;
3、熟练掌握C/C++,Python,Shell编程语言,对数据结构和算法设计有较…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


团队介绍:
高德语音技术部,是负责高德全栈语音技术的综合性团队。团队核心技术能力包括:自研TTS基座大模型、端侧模型、多语种、RTC流式语音、语音内容生成、语音识别、跨模态模型、模型服务与推理。业务支撑面向高德全部核心场景,包括语音导航、AI领航员、IP语音定制、国际化、AI语音助手、智能外呼、内容生成等。
团队定位是通过前沿语音技术的研究和落地,赋能下一代AI产品创新。近期部分技术(https://arxiv.org/abs/2507.12197)和产品进展介绍(https://mp.weixin.qq.com/s/cCeHbNW0jbC_LNVPZlGeHg)

具体职责包括但不限于:
1、语音识别、唤醒、语音与大模型融合等语音模块的研发,独立研究并完成业务落地;
2、结合高德出行导航、语音交互等业务场景,不断完善提升复杂业务场景下的语音理解能力。
3、与产品、工程架构团队一起完成技术方案的部署上线与性能优化,实现价值闭环。
4、持续追踪跟进业界前沿先进语音技术,结合业务需求开展技术创新与预研。
包括英文材料
NLP+
机器学习+
深度学习+
PyTorch+
TensorFlow+
C+
C+++
还有更多 •••
相关职位

logo of alibaba
实习淘天集团2026

参与构建新一代电商语音认知引擎,通过大模型技术实现语音交互与商品理解的双向增强,打造全球领先的电商领域语音智能中枢,支撑淘宝亿级DAU场景的语音搜索、智能导购等核心业务。 1. 负责大模型语音模态的设计、开发和优化,包括但不限于语音音频数据清洗、模型设计、训练策略等方面的研究与应用。 2. 参与语音识别、语音合成、语音理解等相关大模型语音模态能力的建设,提升跨模态整体效果。 3. 跟踪、探索大模型方向,将各模态的SOTA能力集成到模型底座上,提升识别以及搜索能力,提升团队技术先进性。

更新于 2025-05-08北京|杭州
logo of soul
社招

岗位职责 1. 负责语音合成、语音克隆、双工语音通话等语音生成相关技术的数据和模型开发,并协助业务落地; 2. 负责持续跟进业界前沿算法发展方向,支持公司在核心技术上的影响力发展。

更新于 2024-12-09北京
logo of insta360
社招3年以上

1、负责基于传统/AI方案的AEC、语音降噪、阵列算法等音频信号处理算法的研发; 2、负责算法在具体业务场景、项目上的验证、优化和落地工作, 将其部署于端侧平台; 3、跟进行业技术趋势和行业动态,研究新兴技术,保持团队技术领先性。

更新于 2024-10-08深圳
logo of soul
社招

1.负责交互式语音合成,包括但不限于交互式AI播客、双工多模态通话等相关技术的算法研究,并协助业务落地; 2.持续迭代优化基础语音合成大模型算法,提高生成语音的自然度和稳定性; 3.持续跟进业界前沿算法发展方向,推动在核心技术上的影响力发展;

更新于 2024-12-11上海