logo of netease

网易语音交互算法工程师

校招全职人工智能地点:杭州状态:招聘

任职要求


1. 计算机/语音信号处理或相关专业,应届硕士或博士;
2. 扎实的机器学习/深度学习算法基础,熟悉常见的生成式模型的基本原理和调优;
3. 优秀的编程能力和良好的编码习惯;
4. 熟练使用至少一种主流深度学习框架(PyTorch);
5. 有以下至少一个方向的项目经验:
- 语音生成大模型(CosyVoice 2/F5 TTS等);
- 语音识别与理解(FunASR/Whisper/Qwen Audio等);
- 其他生成式模型相关项目(GAN/VAE/LLM/Diffusion);
6. 加分项
- 有语音顶会(ICASSP/Interspeech)或更高级别会议论文;
- 有高Star开源项目;
- 热爱游戏。

工作职责


1. 深度参与雷火各旗舰游戏,实时语音交互、语音内容生产、语音创新玩法等场景研发和落地,为玩家创造崭新的互动娱乐体验;
2. 跟踪语音前沿技术,将最新的语音生成大模型、端到端语音大模型等先进技术落地至业务中;
3. 参与语音算法方案的整个生命周期,包括方案设计、算法实现、数据工程、线上服务等全流程。
包括英文材料
机器学习+
深度学习+
算法+
编程规范+
PyTorch+
大模型+
语音识别+
语音合成+
语音识别+
相关职位

logo of netease
社招3-5年网易伏羲

1、深度参与雷火各旗舰游戏,实时语音交互、语音内容生产、语音创新玩法等场景研发和落地,为玩家创造崭新的互动娱乐体验; 2、跟踪语音前沿技术,将最新的语音生成大模型、端到端语音大模型等先进技术落地至业务中; 3、参与语音算法方案的整个生命周期,包括方案设计、算法实现、数据工程、线上服务等全流程;

更新于 2025-09-01
logo of bytedance
社招A29448

1、支持语音交互技术在字节跳动公司内外丰富的业务场景落地,解决落地过程中的前沿问题,持续优化在智能硬件中的音频理解及处理,以及语音助手核心技术效果; 2、专注端侧智能交互的前沿技术和算法效果,追求和探索业界最前沿算法; 3、负责字节跳动旗下音频内容创作和消费业务场景的智能移频理解和处理算法研发和业务支持; 4、跟踪智能音频领域的最新技术进展并升级团队自研的各算法系统,包括回声消除、AI降噪、多通道音频处理、音频事件理解与检测; 5、跟踪研发业界先进的音频进展,统计模型/机器学习/深度学习技术在语音/音频领域研发并落地产品。

更新于 2025-03-24
logo of bytedance
社招A26261

1、支持语音交互技术在字节跳动公司内外丰富的业务场景落地,解决落地过程中的前沿问题,持续优化在智能硬件中的音频理解及处理,以及语音助手核心技术效果; 2、专注端侧智能交互的前沿技术和算法效果,追求和探索业界最前沿算法; 3、负责字节跳动旗下音频内容创作和消费业务场景的智能移频理解和处理算法研发和业务支持; 4、跟踪智能音频领域的最新技术进展并升级团队自研的各算法系统,包括回声消除、AI降噪、多通道音频处理、音频事件理解与检测; 5、跟踪研发业界先进的音频进展,统计模型/机器学习/深度学习技术在语音/音频领域研发并落地产品。

更新于 2024-07-26
logo of bytedance
社招A183676

1、支持语音交互技术在字节跳动公司内外丰富的业务场景落地,解决落地过程中的前沿问题,持续优化在智能硬件中的音频理解及处理,以及语音助手核心技术效果; 2、专注端侧智能交互的前沿技术和算法效果,追求和探索业界最前沿算法; 3、负责字节跳动旗下音频内容创作和消费业务场景的智能移频理解和处理算法研发和业务支持; 4、跟踪智能音频领域的最新技术进展并升级团队自研的各算法系统,包括回声消除、AI降噪、多通道音频处理、音频事件理解与检测; 5、跟踪研发业界先进的音频进展,统计模型/机器学习/深度学习技术在语音/音频领域研发并落地产品。

更新于 2025-03-28