logo of huya

虎牙语音大模型算法兼职实习生

社招全职MJ003945地点:广州状态:招聘

任职要求


1、本科及以上学历,AI、EE、CS等相关专业,研究方向为语音合成 / 语音大模型自然语言处理或多模态等相关领域。
2、熟悉机器学习深度学习理论,掌握生成模型、多模态大模型等一个或多个方向的理论与算法,具备相关方案实现能力与经验。
3、熟悉端到端语音大模型结构(如VocalNet、SLAM-Omni、GLM-Voice等)。
4、熟悉常见语音合成大模型框架(如CosyVoice、F5-TTS、Index-tts、MegaTTS3、Bert-VITS2等开源框架)。
5、熟悉PytorchPythonC++/CShell等,对数据结构算法设计有深刻理解。
6、熟悉基于LLM的语音合成、端到端方法,持续关注语音/NLP/多模态的前沿技术。
7、具有良好的团队合作精神、技术热情和自驱力。实习时间能至少3个月,能实习6个月以上优先。
8、有ICASSP、Interspeech、ICML等顶会工作、具体实践项目、实验室背景优先。

工作职责


【】
1、负责语音合成系统/语音端到端大模型、全链路算法的技术预研和研发工作。
2、负责大模型的数据积累、框架建设等基建工作。
3、跟踪业界前沿技术,持续探索语音合成、端到端技术的新能力和新应用,提升核心能力。
包括英文材料
学历+
大模型+
NLP+
机器学习+
深度学习+
算法+
SLAM+
BERT+
PyTorch+
Python+
C+++
C+
Bash+
数据结构+
ICML+
相关职位

logo of huya
社招MJ003379

虎牙AIGC团队现在积极招聘实习生来从事内容生成项目。职责包括参与图片视频生成、大语言模型、多模态模型等方向的前沿研究和实践。

更新于 2025-05-28
logo of bilibili
社招技术类

1、负责语音大模型的迭代与优化,涵盖语音识别、语音翻译、语音合成、音色克隆、智能语音对话、音乐生成等通用模型或垂直领域模型的技术升级; 2、跟踪前沿技术动态,开展深入研究,并撰写和发表相关领域高水平学术论文; 3、优化强化学习在语音大模型场景中的应用,推动多模态技术的深度融合; 4、深入研究端到端语音实时交互技术,解决跨语言理解、翻译与合成的关键问题,优化语音输入到多模态输出的全链路效果。

更新于 2025-02-05
logo of meituan
实习核心本地商业-基

你将做什么: 1. 从事情语音大模型方向的前沿技术探索,包括但不限于语音交互大模型、omni 大模型、ASR、TTS、音频理解、音乐合成、音频多模态等方向。 2. 调研前沿工作,跟踪业界相关进展。 3. 算法研发和模型训练,包括但不限于代码编写、数据处理。

更新于 2025-07-21
logo of baidu
社招TPG

-负责语音大模型算法的设计与实现,开展国际领先的前沿算法探索 -负责语音大模型算法模型训练数据飞轮建设 -负责语音交互相关的多模态算法研发 -负责语音大模型下游算法研发

更新于 2024-03-01