logo of youku

优酷日常实习生-语音算法

实习兼职虎鲸文娱2026届实习生招聘地点:北京 | 杭州状态:招聘

任职要求


1、在语音合成、情绪迁移、音频检索、音频分类、声纹识别、语音增强等方面有相关的项目经验,并能够对其中某一领域的算法深入研发并努力创新
2、熟悉传统机器学习基础理论,熟悉深度学习开源框架,深入理解DNN/RNN/CNN/lstm原理,掌握至少一个深度学习
登录查看完整任职要求
微信扫码,1秒登录

工作职责


应用声纹识别、语音合成、情绪迁移等音频技术处理海量音频数据,紧跟业界前沿技术方向,在真实的语音场景进行落地应用,实现音色适配、情绪饱满、高自然度拟人的音频合成,期待追求卓越、自我驱动、聪明乐观的优秀人士加入虎鲸文娱集团,共同开创影视工业化的商业新格局
具体职责包括但不限于:
1、负责基于海量数据和复杂业务场景,和团队其他成员一起构建面向多语言多说话人多情绪的一流语音合成系统
2、负责语音合成相关算法设计,包括Emotional TTS、Speaker Recognition、Instant Voice Clone等模块的算法优化和在实际场景上的落地
3、跟踪业界前沿技术和方法,持续探索语音合成技术的新能力和新应用,解决资源受限场景的实际问题,持续提升语音合成核心能力
包括英文材料
算法+
机器学习+
深度学习+
LSTM+
TensorFlow+
PyTorch+
还有更多 •••
相关职位

logo of bytedance
实习A217191

日常实习:面向全体在校生,为符合岗位要求的同学提供为期3个月及以上的项目实践机会。 团队介绍:Data语音团队致力于语音/音频/音乐相关的AI核心技术研发和产品创新。部门支撑音频和多模态内容从生产、编辑到消费的全流程,赋能内容创作和互动,并以中台形式支持集团多个业务,提供业界前沿的技术能力与解决方案。 1、参与研发多模态模型等下一代人工智能核心技术; 2、关注和推进技术在业务场景中的广泛应用,包括但不限于语言、音乐、语音、音频的生成与理解等; 3、深入调研和关注音频/NLP/多模态等方向的前沿技术。

更新于 2023-07-06深圳
logo of bytedance
实习A87913A

日常实习:面向全体在校生,为符合岗位要求的同学提供为期3个月及以上的项目实践机会。 团队介绍:Data语音团队致力于语音/音频/音乐相关的AI核心技术研发和产品创新。部门支撑音频和多模态内容从生产、编辑到消费的全流程,赋能内容创作和互动,并以中台形式支持集团多个业务,提供业界前沿的技术能力与解决方案。 1、专注端侧智能交互的前沿技术和算法效果,追求和探索业界最前沿算法; 2、跟踪智能音频领域的最新技术进展并升级团队自研的各算法系统,包括回声消除、AI降噪、多通道音频处理、音频事件理解与检测; 3、跟踪研发业界先进的音频进展,统计模型/机器学习/深度学习技术在语音/音频领域研发并落地产品。

更新于 2025-04-10上海
logo of alibaba
实习淘天集团日常实习

1、设计和研发语音多模态大模型在业务场景的落地方案,负责语音模态业务整体pipeline优化,包括但不限于降噪、声纹、ASR、TTS等; 2、结合大模型Agent技术,优化语音+图片多模态下的real time业务落地交互方案; 3、解决业务落地中的关键技术问题,持续跟进业界语音大模型技术最新进展,加速新技术的引进、适配与优化。

更新于 2025-12-05杭州
logo of mihoyo
实习程序&技术类

1、负责语音识别,声纹,情绪及副语言理解等相关模型的开发和调优 2、协助large-scale 的语音数据处理pipeline开发和优化 3、协助评估和分析语音理解模型的效果 4、与算法团队、数据infra团队紧密协作,共同推动语音算法和语音数据链路优化

上海