荣耀语音交互技术高级专家
社招全职10年以上研发类地点:南京 | 上海状态:招聘
任职要求
1、本科及以上学历,计算机科学、电子工程、人工智能等相关专业,硕士、博士学历优先。 2、具备10年以上语音交互相关领域研发经验,精通ASR、TTS、NLU等核心技术原理与工程实现,有大规模语音交互系统研发与落地经验; 3、熟悉主流深度学习框架(TensorFlow、PyTorch等)与语音交互开源工具链,具备解决复杂技术问…
登录查看完整任职要求
微信扫码,1秒登录
工作职责
1、紧跟全球语音交互技术前沿(语音识别ASR、语音合成TTS、自然语言理解NLU、声纹识别等),牵头解决语音交互领域的关键技术难题,如复杂场景下的远场识别、低资源语种适配、情感语音合成、多轮对话意图理解等,突破技术瓶颈,打造行业领先的语音交互技术体系。 2、主导重大语音交互技术研发项目,从需求分析、方案设计、研发实施到测试上线全流程把控,制定项目风险预案,解决项目推进中的关键问题。 3、 推动技术专利布局与学术成果输出,提升公司在行业内的技术影响力,牵头参与行业标准制定,引领语音交互技术发展方向。 4、评估技术商业化潜力,推动技术成果向产品转化,跟踪项目落地后的技术效果与用户反馈,持续迭代优化技术方案,提升语音交互产品的用户体验与市场竞争 5、 对接行业顶尖科研机构、高校及技术合作伙伴,开展产学研合作,引入前沿技术与创新理念;参与行业技术交流与峰会,建立良好的行业技术合作生态。
包括英文材料
学历+
语音识别+
https://developer.nvidia.com/blog/essential-guide-to-automatic-speech-recognition-technology/
Over the past decade, AI-powered speech recognition systems have slowly become part of our everyday lives, from voice search to virtual assistants in contact centers, cars, hospitals, and restaurants.
语音合成+
https://www.ibm.com/think/topics/text-to-speech
Text to speech (TTS) is a type of technology that converts text on a digital interface into natural-sounding audio.
还有更多 •••
相关职位
社招3年以上技术类-开发
1、负责语音方向团队建设,支持整体系统架构设计及核心功能开发; 2、对语音技术进行持续优化,支持先进语音大模型技术落地,提升语音产品的延迟、吞吐、稳定性; 3、负责语音系统的日常维护和迭代升级,发现并解决系统中的技术问题; 4、对接各类算法和业务场景,负责语音大模型相关项目的落地与优化,全链路提升产品语音交互体验。
更新于 2025-12-18广州
社招5年以上技术类-算法
1、负责端侧语音交互模型(语音+语义双工)算法研发、协同工程团队落地和性能优化。 2、负责AI产品的语音识别、语音合成算法的应用和落地,提升识别准确率语与语音合成流畅度,及根据业务场景调优音色和综合的用户体验。 3、跟踪前沿语音AI技术和大语言模型在语音领域的结合应用,跟踪业界端到端的语音大模型能力,评估适配方案并推动技术落地。 4、与产品、后端研发团队协作,推动语音AI技术的快速迭代和业务落地。
更新于 2025-09-12杭州
社招3年以上技术类-算法
1. 负责语音合成、语音识别、端到端语音交互大模型算法的基础研究和应用落地。 2. 参与语音合成与识别技术在业务场景落地,解决落地过程中的前沿问题,持续优化语音合成与识别核心技术效果。 3. 深入调研和关注音频/NLP/多模态/全模态等方向的前沿技术,持续探索语音技术的新能力和新应用。
更新于 2025-12-24北京|杭州