传音资深语音信号处理算法工程师(J17388)
任职要求
具有计算机工程、感知科学、计算语言学、物理学、数学或者相关领域的硕士及以上学位; 具有团队管理经验者优先; 熟练的C/C++编程技巧,掌握一门脚本语言,如Python。具备将机器学习算法在不同的移动平台上进行移植适配,性能优化的能力; 对音频信号处理和内容分析有较好的研究和开发经验; 在模式识别、机器学习、语言学或者信号处理领域有丰富经验; 有较强的学术比赛经验或者在重要数据集的Leaderboard上排名靠前,比如ImageNet等学术数据集或者Kaggle等一些国内外商业比赛者优先; 来自国内外音频信号处理实验室/机 器学习/数据挖掘等领域内知名实验室。
工作职责
研究和开发先进的语音信号处理算法,包括但不限于:语音回声消除、噪声抑制、声纹降噪、麦克风阵列技术等。 组织和协调团队成员紧密合作,完成产品开发和技术创新。
负责语音合成(TTS)核心算法的研发、性能优化与落地实现,推动TTS技术在实际产品中的应用; 结合业务规划,跟进学术界、行业最新的研究趋势,将预研成果落地于实际产品,并主导相关技术方案的制定和实施; 负责TTS相关技术难题的攻关,提升合成语音的自然度、表现力和鲁棒性; 指导和带领初级工程师,提升团队整体技术水平。
1、负责语音理解和语音生成算法在滴滴场景的落地使用 2、跟进最新技术,结合业务场景,提升语音识别、音频事件检测、声纹识别、语音合成等算法效果 3、探索语音大模型或多模态大模型在语音理解及语音生成场景的应用范式 4、算法优化,从模型架构、推理框架、量化压缩等角度提升模型推理速度、降低推理成本 Job Description 1. Responsible for the implementation of speech understanding and speech generation algorithms in Didi’s business scenarios. 2. Stay updated with the latest technologies and improve the performance of algorithms such as speech recognition, audio event detection, speaker recognition in real-world applications. 3. Explore the application paradigms of large language models or multimodal models in speech understanding and generation scenarios. 4. Optimize algorithms by enhancing inference speed and reducing costs through improvements in frameworks and quantization
1、负责语音理解和语音生成算法在滴滴场景的落地使用 2、跟进最新技术,结合业务场景,提升语音识别、音频事件检测、声纹识别、语音合成等算法效果 3、探索语音大模型或多模态大模型在语音理解及语音生成场景的应用范式