logo of youku

优酷算法工程师-语音算法

校招全职虎鲸文娱2026届秋季应届生招聘地点:杭州状态:招聘

任职要求


1、在语音合成、情绪迁移、音频检索、音频分类、声纹识别、语音增强等方面有相关的项目经验,并能够对其中某一领域的算法深入研发并努力创新
2、熟悉传统机器学习基础理论,熟悉深度学习开源框架,深入理解DNN/RNN/CNN/lstm原理,掌握至少一个深度学习
登录查看完整任职要求
微信扫码,1秒登录

工作职责


应用声纹识别、语音合成、情绪迁移等音频技术处理阿里大文娱集团海量音频数据,紧跟业界前沿技术方向,在真实的语音场景进行落地应用,实现音色适配、情绪饱满、高自然度拟人的音频合成,期待追求卓越、自我驱动、聪明乐观的优秀人士加入阿里大文娱集团,共同开创影视工业化的商业新格局

具体职责包括但不限于:
1、负责基于海量数据和复杂业务场景,和团队其他成员一起构建面向多语言多说话人多情绪的一流语音合成系统
2、负责语音合成相关算法设计,包括Emotional TTS、Speaker Recognition、Instant Voice Clone等模块的算法优化和在实际场景上的落地
3、跟踪业界前沿技术和方法,持续探索语音合成技术的新能力和新应用,解决资源受限场景的实际问题,持续提升语音合成核心能力
包括英文材料
算法+
机器学习+
深度学习+
RNN+
CNN+
LSTM+
还有更多 •••
相关职位

logo of jd
实习数据与算法类

1. 负责京东语音识别/合成方向的算法研究和开发工作; 2. 负责将前沿语音算法落地到京东业务场景并取得应用效果。

更新于 2024-03-01北京
logo of alibaba
实习淘天集团2026

参与构建新一代电商语音认知引擎,通过大模型技术实现语音交互与商品理解的双向增强,打造全球领先的电商领域语音智能中枢,支撑淘宝亿级DAU场景的语音搜索、智能导购等核心业务。 1. 负责大模型语音模态的设计、开发和优化,包括但不限于语音音频数据清洗、模型设计、训练策略等方面的研究与应用。 2. 参与语音识别、语音合成、语音理解等相关大模型语音模态能力的建设,提升跨模态整体效果。 3. 跟踪、探索大模型方向,将各模态的SOTA能力集成到模型底座上,提升识别以及搜索能力,提升团队技术先进性。

更新于 2025-05-08北京|杭州
logo of meituan
实习核心本地商业-基

负责语音识别/语音合成/声纹识别等技术方向的算法研究和开发工作,负责将前沿语音算法落地到美团业务场景并取得应用效果。

更新于 2025-02-26北京|上海
logo of antgroup
社招3年以上技术类-算法

1、负责支付宝安全助理及智能外呼产品中的语音交互算法方案的研发,深耕 ASR/TTS 核心技术,构建高鲁棒、低延迟、安全可信的下一代语音交互算法体系。 2、关注语音算法前沿技术和发展动态,拓展算法应用场景。

更新于 2025-12-09上海|杭州