小米语音合成高级算法工程师
社招全职5年以上A240643地点:北京状态:招聘
任职要求
1.本科及以上学历,语音处理/计算机/数学/AI相关专业 2.五年以上语音合成研发经验,熟悉主流语音合成框架技术栈 3.主导过语音/音乐/多模态生成项目全流程研发 4.精通PyTorch/TensorFlow等深度学习框架,Python/C++工程能力突出 5.有ICASSP、Interspeech等语音顶会论文和竞赛经验者优先
工作职责
1.主导语音合成大模型关键技术:模型结构优化、预训练(ICL)、微调(SFT)、语音后训练等 2.研究音频生成新范式(语音/音效/音乐/歌唱)及跨模态大模型技术,推动技术产品化落地 3.结合强化学习、对抗学习、扩散模型等技术提升生成效果,探索语音多模态联合建模
包括英文材料
学历+
PyTorch+
https://datawhalechina.github.io/thorough-pytorch/
PyTorch是利用深度学习进行数据科学研究的重要工具,在灵活性、可读性和性能上都具备相当的优势,近年来已成为学术界实现深度学习算法最常用的框架。
https://www.youtube.com/watch?v=V_xro1bcAuA
Learn PyTorch for deep learning in this comprehensive course for beginners. PyTorch is a machine learning framework written in Python.
TensorFlow+
https://www.youtube.com/watch?v=tpCFfeUEGs8
Ready to learn the fundamentals of TensorFlow and deep learning with Python? Well, you’ve come to the right place.
https://www.youtube.com/watch?v=ZUKz4125WNI
This part continues right where part one left off so get that Google Colab window open and get ready to write plenty more TensorFlow code.
深度学习+
https://d2l.ai/
Interactive deep learning book with code, math, and discussions.
Python+
https://liaoxuefeng.com/books/python/introduction/index.html
中文,免费,零起点,完整示例,基于最新的Python 3版本。
https://www.learnpython.org/
a free interactive Python tutorial for people who want to learn Python, fast.
https://www.youtube.com/watch?v=K5KVEU3aaeQ
Master Python from scratch 🚀 No fluff—just clear, practical coding skills to kickstart your journey!
https://www.youtube.com/watch?v=rfscVS0vtbw
This course will give you a full introduction into all of the core concepts in python.
C+++
https://www.learncpp.com/
LearnCpp.com is a free website devoted to teaching you how to program in modern C++.
https://www.youtube.com/watch?v=ZzaPdXTrSb8
相关职位
社招3-5年网易游戏(雷火)
1. 负责语音业务相关服务(语音合成/语音转换/语音识别)的系统架构设计与工程实现,主导基于FastAPI/Triton Server等框架的高性能服务开发; 2. 优化语音算法在工程化落地中的性能表现,设计高并发、低延迟的语音处理系统,确保服务稳定性和横向扩展能力; 3. 深入理解语音算法原理,熟悉模型压缩、量化及推理加速方案;
更新于 2025-09-18
校招研发类
1、负责语音领域算法能力构建,包括不限于语音识别、声学模型、语言模型、热词技术、语音合成、音频鉴伪等; 2、负责语音领域算法压缩量化、推理加速、小型化部署; 3、参与智慧语音领域的技术规划,面向智慧语音的潜在应用场景,规划技术项目。
更新于 2025-08-07