logo of amap

高德地图高德-语音算法工程师-理解方向

社招全职3年以上技术类-算法地点:北京状态:招聘

任职要求


1、计算机、人工智能、信息、自动化等相关专业本科或研究生,有语音、自然语言处理机器学习、多模态等背景;
2、熟练掌握至少一种主流深度学习框架(PyTorch/TensorFlow),具备实际模型开发与训练经验;
3、熟练掌握C/C++,Python,Shell编程语言,对数据结构和算法设计有较…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


团队介绍:
高德语音技术部,是负责高德全栈语音技术的综合性团队。团队核心技术能力包括:自研TTS基座大模型、端侧模型、多语种、RTC流式语音、语音内容生成、语音识别、跨模态模型、模型服务与推理。业务支撑面向高德全部核心场景,包括语音导航、AI领航员、IP语音定制、国际化、AI语音助手、智能外呼、内容生成等。
团队定位是通过前沿语音技术的研究和落地,赋能下一代AI产品创新。近期部分技术(https://arxiv.org/abs/2507.12197)和产品进展介绍(https://mp.weixin.qq.com/s/cCeHbNW0jbC_LNVPZlGeHg)

具体职责包括但不限于:
1、语音识别、唤醒、语音与大模型融合等语音模块的研发,独立研究并完成业务落地;
2、结合高德出行导航、语音交互等业务场景,不断完善提升复杂业务场景下的语音理解能力。
3、与产品、工程架构团队一起完成技术方案的部署上线与性能优化,实现价值闭环。
4、持续追踪跟进业界前沿先进语音技术,结合业务需求开展技术创新与预研。
包括英文材料
NLP+
机器学习+
深度学习+
PyTorch+
TensorFlow+
C+
C+++
还有更多 •••
相关职位

logo of bilibili
实习技术类

1、音频相关大模型研发,包括音频理解(语音识别/翻译等),音频生成(语音合成/音色克隆/音乐生成)等技术; 2、前沿技术跟进、学术研究及相关论文发表; 3、在B站视频理解、字幕、搜索及创作场景落地。

更新于 2026-04-10上海
logo of bilibili
实习技术类

1、语音对话,情感陪伴对话系统,全双工对话系统等的探索,系统搭建,模型训练; 2、前沿语音技术跟进、行业动态和主流模型框架的调研,学术研究及相关论文发表; 3、数据生成,对话数据开源调研,数据链路清洗,数据管理 4、语音模型的后训练优化,sft,rl等后训练方法的具体实践和优化。情感陪伴的效果调优

更新于 2026-04-10上海
logo of alibaba
实习淘天集团2026

参与构建新一代电商语音认知引擎,通过大模型技术实现语音交互与商品理解的双向增强,打造全球领先的电商领域语音智能中枢,支撑淘宝亿级DAU场景的语音搜索、智能导购等核心业务。 1. 负责大模型语音模态的设计、开发和优化,包括但不限于语音音频数据清洗、模型设计、训练策略等方面的研究与应用。 2. 参与语音识别、语音合成、语音理解等相关大模型语音模态能力的建设,提升跨模态整体效果。 3. 跟踪、探索大模型方向,将各模态的SOTA能力集成到模型底座上,提升识别以及搜索能力,提升团队技术先进性。

更新于 2025-05-08北京|杭州
logo of soul
社招

岗位职责 1. 负责语音合成、语音克隆、双工语音通话等语音生成相关技术的数据和模型开发,并协助业务落地; 2. 负责持续跟进业界前沿算法发展方向,支持公司在核心技术上的影响力发展。

更新于 2024-12-09北京