logo of pingantech

平安科技算法工程师(语音合成方向)

社招全职计算机网络技术类地点:深圳状态:招聘

任职要求


1. 计算机、人工智能、信号处理、语音工程或相关专业硕士及以上学历。  
2. 熟悉主流TTS模型架构,掌握PyTorch框架,具备模型训练与调优经验。  
3. 熟悉语音信号处理基础(如梅尔频谱、STFT、声码器等)。  
4. 具备…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1. 负责语音合成(Text-to-Speech, TTS)模型训练与线上优化。
2. 深入研究并应用深度学习技术,提升合成语音的自然度、表现力和稳定性,支持多音色、多语种、情感语音等高级功能。
3. 参与语音前端处理模块开发,包括文本归一化、分词、音素预测、韵律预测等任务。
4. 与语音识别、语音增强、产品等团队协作,推动TTS技术在实际场景中的落地(如智能助手、有声阅读、导航播报等)。
5. 跟踪学术界和工业界最新进展,持续优化模型性能,降低推理延迟,提升合成效率。
6. 编写高质量的技术文档,参与模型版本管理和工程化部署(如ONNX、TensorRT、Triton等)。
包括英文材料
学历+
语音合成+
还有更多 •••
相关职位

logo of jd
实习数据与算法类

1. 负责京东语音识别/合成方向的算法研究和开发工作; 2. 负责将前沿语音算法落地到京东业务场景并取得应用效果。

更新于 2024-03-01北京
logo of bilibili
实习技术类

1、负责音频相关算法研发,包括但不限于语音合成、歌声合成、声音转换、音乐理解、音乐生成等; 2、负责音频相关算法在产品中落地,建设行业先进音频内容理解和生产能力,落地公司各个业务场景; 3、跟踪前沿的算法理论,并将优秀算法应用到实际业务中,提升业务效果; 4、参与PGC语音、音乐内容的创意和制作,一同打造声音体验; 5、与多元化的团队合作,将你的语言、音乐知识应用于前沿的AI项目。

更新于 2025-03-04上海
logo of meituan
实习核心本地商业-基

负责语音识别/语音合成/声纹识别等技术方向的算法研究和开发工作,负责将前沿语音算法落地到美团业务场景并取得应用效果。

更新于 2025-02-26北京|上海
logo of alibaba
实习淘天集团2026

参与构建新一代电商语音认知引擎,通过大模型技术实现语音交互与商品理解的双向增强,打造全球领先的电商领域语音智能中枢,支撑淘宝亿级DAU场景的语音搜索、智能导购等核心业务。 1. 负责大模型语音模态的设计、开发和优化,包括但不限于语音音频数据清洗、模型设计、训练策略等方面的研究与应用。 2. 参与语音识别、语音合成、语音理解等相关大模型语音模态能力的建设,提升跨模态整体效果。 3. 跟踪、探索大模型方向,将各模态的SOTA能力集成到模型底座上,提升识别以及搜索能力,提升团队技术先进性。

更新于 2025-05-08北京|杭州