优酷优酷-语音算法专家-杭州/北京

社招全职3年以上2025-12-16地点：北京 | 杭州状态：招聘

扫码手机上打开

任职要求

1、在语音合成、音乐生成、文生音频、视频生音频等方面有相关的项目经验，并能够对其中某一领域的算法深入研发并努力创新；
2、熟悉传统机器学习基础理论，熟悉深度学习开源框架，深入理解CNN/RNN/VAE/GAN/Transformer/Diffusion等模型原理,掌握至少…

登录查看完整任职要求

微信扫码，1秒登录

工作职责

应用声纹识别、音频理解、音频增强等音频技术处理海量音频数据，紧跟业界前沿技术方向，参与构建生成式音频系统，从文本、视频、音频等多模态输入出发，研发高自然度、风格多样、可控性强的语音、音乐与音效生成模型，期待追求卓越、自我驱动、聪明乐观的优秀人士加入虎鲸文娱集团，共同开创影视工业化的商业新格局。
具体职责包括但不限于：
1、负责基于海量数据和复杂业务场景，和团队其他成员一起构建面向真实影视剧场景的一流音频合成系统，共同推动技术产品化与商业化；
2、负责音频合成相关算法设计，覆盖以下一个或多个方向：
ꔷ 高拟人度、情绪丰富的语音合成，包括Emotional TTS、Speaker Recognition、Instant Voice Clone等模块的优化与落地；
ꔷ 跨模态音频生成，包括Video-to-Audio、Text-to-Audio等方向的模型优化与落地；
ꔷ 端到端的音乐生成，包括Lyric-to-Song, CoT, ICL等模块的优化与落地；
3、跟踪业界前沿技术和方法，持续探索音频合成技术的新能力和新应用，解决资源受限场景的实际问题，持续提升音频合成核心能力

📮 投递简历 ✨AI模拟面试

难度：

包括英文材料

算法+

机器学习+

深度学习+

LSTM+

TensorFlow+

PyTorch+

C+

还有更多 •••

登录查看完整学习资料

相关职位

千问C端事业群-语音识别算法专家-杭州/北京

社招1年以上技术类-算法

1.负责声学前端、声学模型、语言模型、后处理、解码器等主要模块的迭代和改进； 2.负责优化双工交互系统，提高系统的鲁棒性和性能； 3.负责优化语音识别大模型、流式语音识别、音频理解大模型、语音端到端大模型等； 4.追踪业界前沿的语音技术，探索语音大模型在业务场景下的应用。

更新于 2025-12-22北京|杭州

智能信息-语音大模型算法专家/高级专家-杭州/北京

社招2年以上技术类-算法

1. 负责语音合成、语音识别、端到端语音交互大模型算法的基础研究和应用落地； 2. 参与语音合成与识别技术在业务场景落地，解决落地过程中的前沿问题，持续优化语音合成与识别核心技术效果； 3. 深入调研和关注音频/NLP/多模态/全模态等方向的前沿技术，持续探索语音技术的新能力和新应用。

更新于 2025-09-19北京|杭州

智能信息-语音识别算法专家-北京/杭州

社招2年以上技术类-算法

1. 负责语音识别和语音对话大模型的算法研发与优化，包括声学模型、LLM模型和解码器等，探索新的算法架构，建设高效率、低时延的语音应用系统； 2. 结合业务需求，持续改进现有模型的性能，确保其在不同应用场景下的准确性和鲁棒性，提升语音助手和语音智能体用户体验； 3. 构建和管理大规模语音识别和语音对话语料库，用于训练、验证和测试模型； 4. 跟踪前沿技术和研究动态，提出新颖的算法思路和解决方案。

更新于 2025-08-19北京|杭州

通义实验室-语音识别算法专家-北京/杭州

社招2年以上技术类-算法

1. 负责语音识别和语音对话大模型的算法研发与优化，包括声学模型、LLM模型和解码器等，探索新的算法架构，建设高效率、低时延的语音应用系统。 2. 结合业务需求，持续改进现有模型的性能，确保其在不同应用场景下的准确性和鲁棒性，提升语音助手和语音智能体用户体验。 3. 构建和管理大规模语音识别和语音对话语料库，用于训练、验证和测试模型。 4. 跟踪前沿技术和研究动态，提出新颖的算法思路和解决方案。

更新于 2026-01-19北京|杭州