logo of didi

滴滴AIoT产品事业部-算法实习生

实习兼职算法类地点:北京状态:招聘

任职要求


1、对语音合成等语音技术感兴趣
2、了解语音合成、音频信号处理基本原理和主流语音合成框架(如 CoSyVoice、F5、Bert-VITS、GPT-SoVITS 等)
3、本科及以上,计算机、电子…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1、参与语音大模型应用研发
2、探索音频对话、理解技术方案,参与模型研发
3、调研探索语音合成新范式,参与模型效果验证与调优
4、协助扩展语音合成能力,包括方言、多语种、拟人化、声学属性控制等
包括英文材料
语音合成+
还有更多 •••
相关职位

logo of didi
实习技术类

1、协助团队进行大模型语音合成(TTS)相关算法研发,包括但不限于: 1)参与基于 Transformer、VITS、扩散模型的语音合成模型训练与优化; 2)协助优化大模型在多风格、多情感、个性化语音生成场景的效果; 3)参与语音合成模型的轻量化部署与推理加速(如模型压缩、TensorRT 优化等); 2、数据处理与模型调优: 1)协助构建和清洗多语种、多场景语音数据集(音频切割、文本标注、质量校验等); 2)参与模型训练过程中的参数调优、损失函数改进,提升合成语音的自然度与相似度; 3)分析模型合成结果,定位问题(如韵律失调、音色偏差)并提出优化方案; 3、技术调研与工具开发: 1)跟踪国内外大模型语音合成领域最新研究; 2)协助开发语音合成效果评测工具(如 MOS 评分自动化脚本、音频特征分析工具);

更新于 2025-07-11北京
logo of didi
社招3年以上数据

1、负责AIoT产品事业部数据研发,包括:离线数仓、实时数仓、线上数据服务; 2、负责抽象核心业务流程,与运营、产品、算法、后端等团队协作,开发数仓中间层和数据应用产品,高效保质落地; 3、负责数据治理、技术升级等,持续提升数仓建设的质量和效率。

更新于 2025-07-21北京
logo of didi
校招工程-后端类

1、参与滴滴 AIoT 产品事业部服务端研发工作,包括桔视、语音等产品研发,提升产品力,承接来自于网约车、无人车等需求研发 2、理解业务场景,与算法、产品、硬件、运营等团队协作,按期按质保障需求及项目落地 3、参与 AIoT 平台研发建设,包含稳定性、效率提升、成本优化、技术升级等方面工作。

更新于 2025-08-18北京
logo of didi
社招3年以上技术

1. 参与 AIoT 事业部 Android 端研发工作,包括桔视设备、语音等产品研发,提升产品力,承接来自于网约车、无人车等需求研发 2. 理解业务场景,与算法、产品、硬件、运营等团队协作,按期按质保障需求及项目落地 3. 参与 AIoT 平台研发建设,包含稳定性、效率提升、成本优化、技术升级等方面工作 4. 负责Android客户端核心模块设计与开发,主导技术方案选型及系统架构优化

更新于 2025-06-23杭州