logo of pingantech

平安科技算法工程师(语音识别方向)

社招全职计算机网络技术类地点:深圳状态:招聘

任职要求


1、对以下一种或多种语音识别领域有较深入的研究:端到端语音识别算法,自监督学习算法,说话人角色区分(speaker diarization),对模型原理有较深入的理解。 
2、熟悉pytorch/tensorflow 深度学习框架,以及python/c+
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1、负责语音识别大模型方向的算法创新,模型训练及落地
2、分析业务反馈的语音识别生产问题,并提供优化解决方案
包括英文材料
语音识别+
算法+
PyTorch+
TensorFlow+
还有更多 •••
相关职位

logo of jd
实习数据与算法类

1. 负责京东语音识别/合成方向的算法研究和开发工作; 2. 负责将前沿语音算法落地到京东业务场景并取得应用效果。

更新于 2024-03-01北京
logo of meituan
实习核心本地商业-基

负责语音识别/语音合成/声纹识别等技术方向的算法研究和开发工作,负责将前沿语音算法落地到美团业务场景并取得应用效果。

更新于 2025-02-26北京|上海
logo of alibaba
实习淘天集团2026

参与构建新一代电商语音认知引擎,通过大模型技术实现语音交互与商品理解的双向增强,打造全球领先的电商领域语音智能中枢,支撑淘宝亿级DAU场景的语音搜索、智能导购等核心业务。 1. 负责大模型语音模态的设计、开发和优化,包括但不限于语音音频数据清洗、模型设计、训练策略等方面的研究与应用。 2. 参与语音识别、语音合成、语音理解等相关大模型语音模态能力的建设,提升跨模态整体效果。 3. 跟踪、探索大模型方向,将各模态的SOTA能力集成到模型底座上,提升识别以及搜索能力,提升团队技术先进性。

更新于 2025-05-08北京|杭州
logo of pingantech
社招计算机网络技术类

1. 负责语音合成(Text-to-Speech, TTS)模型训练与线上优化。 2. 深入研究并应用深度学习技术,提升合成语音的自然度、表现力和稳定性,支持多音色、多语种、情感语音等高级功能。 3. 参与语音前端处理模块开发,包括文本归一化、分词、音素预测、韵律预测等任务。 4. 与语音识别、语音增强、产品等团队协作,推动TTS技术在实际场景中的落地(如智能助手、有声阅读、导航播报等)。 5. 跟踪学术界和工业界最新进展,持续优化模型性能,降低推理延迟,提升合成效率。 6. 编写高质量的技术文档,参与模型版本管理和工程化部署(如ONNX、TensorRT、Triton等)。

更新于 2026-04-08深圳