vivo语音增强算法工程师/专家
任职要求
1、计算机或相关专业背景,掌握语音增强算法基础理论知识; 2、五年以上相关工作经验,熟练掌握C/C++、MATLAB、Python等编程语言; 3、熟悉Tensorflow/PyTorch深度学习框架,并有相关实际应用及…
工作职责
岗位描述: 1、负责语音增强相关算法的研究、仿真和开发工作,包括但不限于麦克风阵列、回声消除、噪声抑制、端点检测等; 2、负责语音增强深度学习方向的技术研究及落地,结合传统信号处理优化复杂场景下的语音增强效果,提升AI语音产品的交互质量及用户体验; 3、负责将语音增强算法应用到手机终端,优化算法效果、计算性能、内存、功耗等指标; 4、探索语音增强技术前沿领域知识,跟进国际顶级学术界成果和工业界项目。
岗位描述: 1、负责语音增强相关算法的研究、仿真和开发工作,包括但不限于麦克风阵列、回声消除、噪声抑制、端点检测等; 2、负责语音增强深度学习方向的技术研究及落地,结合传统信号处理优化复杂场景下的语音增强效果,提升AI语音产品的交互质量及用户体验; 3、负责将语音增强算法应用到手机终端,优化算法效果、计算性能、内存、功耗等指标; 4、探索语音增强技术前沿领域知识,跟进国际顶级学术界成果和工业界项目。
语音是人机交互中最自然、最便捷的模态。随着大模型时代的到来,语音AI的研究正从单一任务向多模态、高自然度交互演进。在阿里巴巴,我们的语音技术已深度植入流媒体、直播互动、智能客服、办公会议、AIoT及数字人等多元场景。我们正在寻找志同道合的伙伴,共同探索语音技术在复杂场景下的极限。在这里,你不仅能触达海量的真实数据,更能亲手打造影响亿万用户的交互体验。一段更具挑战、更有成就感的旅程正待开启! 岗位职责: 1. 核心算法研发: 负责语音信号处理领域的前沿算法研究与落地,包括但不限于语音识别(ASR)、语音合成(TTS)、说话人识别与分离(Speaker Verification/Diarization)、语音增强及端到端语音交互方案; 2. 专项技术突破: ● 声纹与属性识别: 负责声纹识别、语种识别以及情绪识别(Emotion Recognition)的算法优化,提升在真实业务场景下的识别精度与跨域泛化能力; ● 音频内容理解: 基于语义与声学特征,深度挖掘语音中的情感、意图及环境信息,赋能直播审核、内容分析等业务; ● AI-VAD: 研发基于深度学习的高鲁棒性语音活动检测(VAD)算法,解决强噪声、多语者叠加、远场等复杂环境下的起停点检测痛点; 3. 模型工程化落地: 推动算法在云端或端侧的部署优化,在保障性能(精度/鲁棒性)的同时,平衡算力消耗与推理延迟; 4. 技术预研: 跟踪并探索语音领域前沿技术(如大语言模型与语音的结合、Speech-to-Speech原生端到端交互等)。
1. 负责车载声学信号处理的相关核心算法研究和实现,包括且不限于语音增强、回声消除、声源定位、语音分离等; 2. 针对实际场景评估硬件选型,设计阵列排布,对算法进行优化、调试,并将算法进行工程化落地,达到可量产大规模使用的实际性能