logo of mi

小米语音合成高级算法工程师

社招全职5年以上A240643地点:北京状态:招聘

任职要求


1.本科及以上学历,语音处理/计算机/数学/AI相关专业
2.五年以上语音合成研发经验,熟悉主流语音合成框架技术栈
3.主导过语音/音乐/多模态生成项目全流程研发
4.精通PyTorch/TensorFlow深度学习框架,Python/C++工程能力突出
5.有ICASSP、Interspeech等语音顶会论文和竞赛经验者优先

工作职责


1.主导语音合成大模型关键技术:模型结构优化、预训练(ICL)、微调(SFT)、语音后训练等
2.研究音频生成新范式(语音/音效/音乐/歌唱)及跨模态大模型技术,推动技术产品化落地
3.结合强化学习、对抗学习、扩散模型等技术提升生成效果,探索语音多模态联合建模
包括英文材料
学历+
PyTorch+
TensorFlow+
深度学习+
Python+
C+++
相关职位

logo of netease
社招3-5年网易游戏(雷火)

1. 负责语音业务相关服务(语音合成/语音转换/语音识别)的系统架构设计与工程实现,主导基于FastAPI/Triton Server等框架的高性能服务开发; 2. 优化语音算法在工程化落地中的性能表现,设计高并发、低延迟的语音处理系统,确保服务稳定性和横向扩展能力; 3. 深入理解语音算法原理,熟悉模型压缩、量化及推理加速方案;

更新于 2025-09-18
logo of 58
社招技术类

负责自研语音识别引擎中的语音识别算法研发。

更新于 2022-02-10
logo of honor
校招研发类

1、负责语音领域算法能力构建,包括不限于语音识别、声学模型、语言模型、热词技术、语音合成、音频鉴伪等; 2、负责语音领域算法压缩量化、推理加速、小型化部署; 3、参与智慧语音领域的技术规划,面向智慧语音的潜在应用场景,规划技术项目。

更新于 2025-08-07
logo of tencent
社招3年以上CSIG技术

1.负责语音识别ASR应用涉及的效果调优与实现,比如多语种语音识别与翻译(中/英/法/日/韩/东南亚/中东等)、端侧超级轻量级高效ASR的落地实现、解决目标说话人增强的ASR相关技术的落地、声学/语意vad等; 2.负责语音识别asr-llm大模型与前沿技术调研与落地,比如更合理的语音与文本对齐、适用于多语种的模型方案、更高效的弱监督数据筛选流程等; 3.负责跟踪并复现业界最前沿的音频处理方案,并能融合优化当前效果。

更新于 2025-08-05