logo of amap

高德地图语音算法实习生

实习兼职高德研究型实习生地点:北京状态:招聘

任职要求


1、计算机、人工智能等相关专业本科或研究生,有语音、自然语言处理、多模态等背景;
2、熟练掌握至少一种主流深度学习框架(PyTorch/TensorFlow),具备实际模型开发与训练经验;
3、熟练掌握C/C++PythonShell编程语言,对数据结构和算法设计有较好的理解;…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


团队介绍:
高德语音技术部,是负责高德全栈语音技术的综合性团队。团队核心技术能力包括:自研TTS基座大模型、端侧模型、多语种、RTC流式语音、语音内容生成、语音识别、多模态模型、模型服务与推理。业务支撑面向高德全部核心场景,包括语音导航、AI领航员、IP语音定制、国际化、AI语音助手、智能外呼、内容生成等。
团队定位是通过前沿语音技术的研究和落地,赋能下一代AI产品创新。近期部分技术(https://arxiv.org/abs/2507.12197)和产品进展介绍(https://mp.weixin.qq.com/s/cCeHbNW0jbC_LNVPZlGeHg)

具体职责:
1、参与语音识别、语音合成、Audio Codec、语音大模型等语音能力的设计和训练,解决高德业务场景实际问题。
2、提升鲁棒ASR、多语种(方言)ASR、LLM-ASR、大规模热词、全双工交互等语音理解能力。
3、提升Zero-Shot TTS、多语种TTS、情感TTS、声音复刻等语音生成能力。
4、持续追踪跟进业界前沿先进语音技术,结合业务需求开展技术创新与预研。
包括英文材料
NLP+
深度学习+
PyTorch+
TensorFlow+
C+
C+++
Python+
还有更多 •••
相关职位

logo of insta360
实习

1、负责语音降噪、语音唤醒、语音识别等前沿语音算法的研发; 2、负责算法模型在业务场景数据集上的优化,导出部署在端侧或云端平台; 3、跟进行业最新算法动态,复现和优化前沿算法,保持算法在工业界和学术界的领先

更新于 2025-03-10深圳
logo of ztgame
实习实习生

1、参与多模态语音理解+生成(speech、audio、music)领域的科研,效果优秀后推动在视频、游戏业务场景下的算法研发、落地,包括但不限于数据处理、模型训练、效果调优; 2、紧跟前沿技术、参与关键技术创新、突破与积累,撰写论文。

更新于 2025-08-13上海
logo of baidu
实习TPG

-跟踪识别前沿相关技术 -负责大数据合成等技术研发和业务支持 -负责视频AEC技术的研发和业务支持 -负责说话人技术的研发和业务支持

更新于 2024-09-23北京
logo of baidu
实习TPG

-实验最新语音合成、理解方案,并对其中的模块进行解耦和分析。 -结合大模型范式,参与研发语音Encodec、Decoder、多模态对齐等模块,构建LLM based TTS和端到端Speech2Speech系统。 -参与到具体的语言合成业务落地工作 -参与语音大模型的评测及优化。

更新于 2025-04-11北京