百度AI语音算法工程师(J84569)
社招全职ACG地点:上海状态:招聘
任职要求
-计算机科学、电子工程、信号处理或相关专业本科及以上学历,具有扎实的数学基础和编程能力 -熟悉语音信号处理、语音识别、语音合成等基本原理和算法 -熟练掌握C/C++、Python等编程语言,熟悉Linux操作系统和常用开发工具; -了解常用的语音算法库和工具,如K…
登录查看完整任职要求
微信扫码,1秒登录
工作职责
-负责语音信号处理算法的研究、设计、开发和优化,包括但不限于特征提取、降噪、回声消除等 -参与语音识别算法的研发,提高识别准确率和识别速度 -负责语音合成算法的开发,优化语音生成的音质和流畅度 -跟踪语音技术领域的最新动态,研究新技术和新算法,为公司技术储备提供支持 -与其他技术栈紧密合作,确保语音算法在公司产品中的有效应用 -编写相关技术文档,包括算法设计文档、测试报告、使用说明等
包括英文材料
学历+
语音识别+
https://www.youtube.com/watch?v=mYUyaKmvu6Y
Learn how to implement speech recognition in Python by building five projects.
https://www.youtube.com/watch?v=sR6_bZ6VkAg
How Rev.com harnesses human-in-the-loop and deep learning to build the world's best English speech recognition engine
算法+
https://roadmap.sh/datastructures-and-algorithms
Step by step guide to learn Data Structures and Algorithms in 2025
https://www.hellointerview.com/learn/code
A visual guide to the most important patterns and approaches for the coding interview.
https://www.w3schools.com/dsa/
C+
https://www.freecodecamp.org/chinese/news/the-c-beginners-handbook/
本手册遵循二八定律。你将在 20% 的时间内学习 80% 的 C 编程语言。
https://www.youtube.com/watch?v=87SH2Cn0s9A
https://www.youtube.com/watch?v=KJgsSFOSQv0
This course will give you a full introduction into all of the core concepts in the C programming language.
https://www.youtube.com/watch?v=PaPN51Mm5qQ
In this complete C programming course, Dr. Charles Severance (aka Dr. Chuck) will help you understand computer architecture and low-level programming with the help of the classic C Programming language book written by Brian Kernighan and Dennis Ritchie.
还有更多 •••
相关职位
社招ACG
-负责语音信号处理算法的研究、设计、开发和优化,包括但不限于特征提取、降噪、回声消除等 -参与语音识别算法的研发,提高识别准确率和识别速度 -负责语音合成算法的开发,优化语音生成的音质和流畅度 -跟踪语音技术领域的最新动态,研究新技术和新算法,为公司技术储备提供支持 -与其他技术栈紧密合作,确保语音算法在公司产品中的有效应用 -编写相关技术文档,包括算法设计文档、测试报告、使用说明等
更新于 2025-04-21上海
社招3年以上技术类-算法
团队介绍: 高德语音技术部,是负责高德全栈语音技术的综合性团队。团队核心技术能力包括:自研TTS基座大模型、端侧模型、多语种、RTC流式语音、语音内容生成、语音识别、跨模态模型、模型服务与推理。业务支撑面向高德全部核心场景,包括语音导航、AI领航员、IP语音定制、国际化、AI语音助手、智能外呼、内容生成等。 团队定位是通过前沿语音技术的研究和落地,赋能下一代AI产品创新。近期部分技术(https://arxiv.org/abs/2507.12197)和产品进展介绍(https://mp.weixin.qq.com/s/cCeHbNW0jbC_LNVPZlGeHg) 具体职责包括但不限于: 1、语音识别、唤醒、语音与大模型融合等语音模块的研发,独立研究并完成业务落地; 2、结合高德出行导航、语音交互等业务场景,不断完善提升复杂业务场景下的语音理解能力。 3、与产品、工程架构团队一起完成技术方案的部署上线与性能优化,实现价值闭环。 4、持续追踪跟进业界前沿先进语音技术,结合业务需求开展技术创新与预研。
更新于 2025-09-09北京