网易语音识别(ASR)算法工程师
任职要求
1. 硕士及以上学历,计算机、人工智能、电子信息或相关专业,具备扎实的数学和算法基础; 2. 3年以上语音识别相关领域工作经验,熟悉主流语音识别框架(如Kaldi、ESPnet、DeepSpeech等)及深度学习模型(如Transformer、Conformer); 3. 熟练掌握Python和常用深度学习框架(如PyTorch、TensorFlow)…
工作职责
1. 负责语音识别模型的设计与开发,持续优化模型结构以提升识别准确率和鲁棒性; 2. 跟踪国内外语音识别领域前沿技术,包括端到端模型、自监督学习等主流算法进展; 3. 参与大规模语音数据的处理与建模,构建高质量的训练与评测体系; 4. 开展语音大模型的研发工作,探索在低资源、远场、噪声等复杂场景下的应用优化; 5. 参与多模态大模型的融合与创新,推动语音与其他模态(如文本、视觉)的联合建模; 6. 协同工程团队完成模型部署与性能调优,支持产品落地与实际应用场景需求。
负责蔚来海外智能座舱的多语言语音识别(ASR)算法研发与优化,覆盖主流语种(如英语、德语、法语等)及小语种场景。 负责国际业务中多语种语音识别系统的需求沟通、性能评估,设计验收方案和验收标准,指导供应商技术改进或提出可行的解决方案,完成供应商交付的语音识别功能验收。 对语音识别中出现的问题进行数据分析与排查,定位识别效果不佳的原因,并进行改进优化。 与数据团队合作,构建高质量多语种语音数据集,优化数据标注流程及数据增强策略。
1、负责核心算法研发: 1)负责语音识别(ASR)算法的设计与优化,构建高精度、低延时的语音处理系统; 2)主导语种识别(LID)、说话人分离(SSD)等语音相关技术的研发与落地; 3)深入探索Whisper/FunASR等开源语音项目,结合业务需求进行技术创新与改进; 2、负责技术应用与优化: 1)将语音算法应用于会议转录、实时字幕、语音消息等ToB办公场景; 2)优化语音模型在云端的推理性能,提升资源利用效率; 3)建设语音领域的高质量数据集及评测体系; 3、工程能力建设: 1)深入使用Python进行算法开发,熟练应用PyTorch/TensorFlow搭建训练Pipeline; 2)构建高性能推理框架,探索TensorRT/Triton/OnnxRuntime等加速工具的应用; 4、跨团队协作: 1)与产品团队合作挖掘用户需求,推动语音技术在产品中的创新应用; 2)与工程团队协作完成模型部署,解决端到端落地中的技术挑战; 5、技术前瞻性研究: 1)持续跟踪ICASSP/INTERSPEECH等顶会最新进展; 2)探索语音与大模型结合的创新方向。
1、负责核心算法研发: 1)负责语音识别(ASR)算法的设计与优化,构建高精度、低延时的语音处理系统; 2)主导语种识别(LID)、说话人分离(SSD)等语音相关技术的研发与落地; 3)深入探索Whisper/FunASR等开源语音项目,结合业务需求进行技术创新与改进; 2、负责技术应用与优化: 1)将语音算法应用于会议转录、实时字幕、语音消息等ToB办公场景; 2)优化语音模型在云端的推理性能,提升资源利用效率; 3)建设语音领域的高质量数据集及评测体系; 3、工程能力建设: 1)深入使用Python进行算法开发,熟练应用PyTorch/TensorFlow搭建训练Pipeline; 2)构建高性能推理框架,探索TensorRT/Triton/OnnxRuntime等加速工具的应用; 4、跨团队协作: 1)与产品团队合作挖掘用户需求,推动语音技术在产品中的创新应用; 2)与工程团队协作完成模型部署,解决端到端落地中的技术挑战; 5、技术前瞻性研究: 1)持续跟踪ICASSP/INTERSPEECH等顶会最新进展; 2)探索语音与大模型结合的创新方向。