网易语音算法实习生(短期实习)
实习兼职网易游戏(互娱)地点:广州状态:招聘
任职要求
1、编程基础扎实,熟悉Python等至少一种编程语言,有良好的编程习惯和代码风格; 2、在读本科或研究生,计算机科学、电子工程、信息科学、信号处理或相关专业; 3、对语音有浓厚的兴趣,熟悉语音相关技术算法,有ASR/…
登录查看完整任职要求
微信扫码,1秒登录
工作职责
A. 算法研发工作: 1)、协助进行语音清洗相关模块的优化和测试; 2)、学习FunASR/StepAudio/Cosyvoice等开源项目,结合业务场景参与技术改进方案讨论; 3)、参与语音合成大模型研究,协助发现和解决实际应用中遇到的问题; B. 落地实践工作: 1)、负责语音数据的预处理、标注、清洗等相关工作,搭建评测体系; 2)、负责音频相关算法在产品中落地,建设行业先进音频内容理解和生产能力,落地公司各个业务场景;
包括英文材料
Python+
https://liaoxuefeng.com/books/python/introduction/index.html
中文,免费,零起点,完整示例,基于最新的Python 3版本。
https://www.learnpython.org/
a free interactive Python tutorial for people who want to learn Python, fast.
https://www.youtube.com/watch?v=K5KVEU3aaeQ
Master Python from scratch 🚀 No fluff—just clear, practical coding skills to kickstart your journey!
https://www.youtube.com/watch?v=rfscVS0vtbw
This course will give you a full introduction into all of the core concepts in python.
编程规范+
[英文] Google Style Guides
https://google.github.io/styleguide/
Every major open-source project has its own style guide: a set of conventions (sometimes arbitrary) about how to write code for that project. It is much easier to understand a large codebase when all the code in it is in a consistent style.
算法+
https://roadmap.sh/datastructures-and-algorithms
Step by step guide to learn Data Structures and Algorithms in 2025
https://www.hellointerview.com/learn/code
A visual guide to the most important patterns and approaches for the coding interview.
https://www.w3schools.com/dsa/
语音识别+
https://developer.nvidia.com/blog/essential-guide-to-automatic-speech-recognition-technology/
Over the past decade, AI-powered speech recognition systems have slowly become part of our everyday lives, from voice search to virtual assistants in contact centers, cars, hospitals, and restaurants.
还有更多 •••
相关职位
实习
1、负责语音降噪、语音唤醒、语音识别等前沿语音算法的研发; 2、负责算法模型在业务场景数据集上的优化,导出部署在端侧或云端平台; 3、跟进行业最新算法动态,复现和优化前沿算法,保持算法在工业界和学术界的领先
更新于 2025-03-10深圳

实习实习生
1、参与多模态语音理解+生成(speech、audio、music)领域的科研,效果优秀后推动在视频、游戏业务场景下的算法研发、落地,包括但不限于数据处理、模型训练、效果调优; 2、紧跟前沿技术、参与关键技术创新、突破与积累,撰写论文。
更新于 2025-08-13上海
实习高德研究型实习生
团队介绍: 高德语音技术部,是负责高德全栈语音技术的综合性团队。团队核心技术能力包括:自研TTS基座大模型、端侧模型、多语种、RTC流式语音、语音内容生成、语音识别、多模态模型、模型服务与推理。业务支撑面向高德全部核心场景,包括语音导航、AI领航员、IP语音定制、国际化、AI语音助手、智能外呼、内容生成等。 团队定位是通过前沿语音技术的研究和落地,赋能下一代AI产品创新。近期部分技术(https://arxiv.org/abs/2507.12197)和产品进展介绍(https://mp.weixin.qq.com/s/cCeHbNW0jbC_LNVPZlGeHg) 具体职责: 1、参与语音识别、语音合成、Audio Codec、语音大模型等语音能力的设计和训练,解决高德业务场景实际问题。 2、提升鲁棒ASR、多语种(方言)ASR、LLM-ASR、大规模热词、全双工交互等语音理解能力。 3、提升Zero-Shot TTS、多语种TTS、情感TTS、声音复刻等语音生成能力。 4、持续追踪跟进业界前沿先进语音技术,结合业务需求开展技术创新与预研。
更新于 2025-12-17北京