logo of netease

网易语音识别(ASR)算法工程师

社招全职3年以下网易有道地点:北京状态:招聘

任职要求


1. 硕士及以上学历,计算机、人工智能、电子信息或相关专业,具备扎实的数学和算法基础;
2. 3年以上语音识别相关领域工作经验,熟悉主流语音识别框架(如Kaldi、ESPnet、DeepSpeech等)及深度学习模型(如Transformer、Conformer);
3. 熟练掌握Python和常用深度学习框架(如PyTorch、TensorFlow)…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1.  负责语音识别模型的设计与开发,持续优化模型结构以提升识别准确率和鲁棒性;
2.  跟踪国内外语音识别领域前沿技术,包括端到端模型、自监督学习等主流算法进展;
3.  参与大规模语音数据的处理与建模,构建高质量的训练与评测体系;
4.  开展语音大模型的研发工作,探索在低资源、远场、噪声等复杂场景下的应用优化;
5.  参与多模态大模型的融合与创新,推动语音与其他模态(如文本、视觉)的联合建模;
6.  协同工程团队完成模型部署与性能调优,支持产品落地与实际应用场景需求。
包括英文材料
学历+
算法+
语音识别+
深度学习+
Transformer+
Python+
还有更多 •••
相关职位

logo of nio
社招7-10年数字技术

负责蔚来海外智能座舱的多语言语音识别(ASR)算法研发与优化,覆盖主流语种(如英语、德语、法语等)及小语种场景。 负责国际业务中多语种语音识别系统的需求沟通、性能评估,设计验收方案和验收标准,指导供应商技术改进或提出可行的解决方案,完成供应商交付的语音识别功能验收。 对语音识别中出现的问题进行数据分析与排查,定位识别效果不佳的原因,并进行改进优化。 与数据团队合作,构建高质量多语种语音数据集,优化数据标注流程及数据增强策略。

更新于 2025-05-26北京|上海
logo of bytedance
社招3年以上A250240

1、负责核心算法研发: 1)负责语音识别(ASR)算法的设计与优化,构建高精度、低延时的语音处理系统; 2)主导语种识别(LID)、说话人分离(SSD)等语音相关技术的研发与落地; 3)深入探索Whisper/FunASR等开源语音项目,结合业务需求进行技术创新与改进; 2、负责技术应用与优化: 1)将语音算法应用于会议转录、实时字幕、语音消息等ToB办公场景; 2)优化语音模型在云端的推理性能,提升资源利用效率; 3)建设语音领域的高质量数据集及评测体系; 3、工程能力建设: 1)深入使用Python进行算法开发,熟练应用PyTorch/TensorFlow搭建训练Pipeline; 2)构建高性能推理框架,探索TensorRT/Triton/OnnxRuntime等加速工具的应用; 4、跨团队协作: 1)与产品团队合作挖掘用户需求,推动语音技术在产品中的创新应用; 2)与工程团队协作完成模型部署,解决端到端落地中的技术挑战; 5、技术前瞻性研究: 1)持续跟踪ICASSP/INTERSPEECH等顶会最新进展; 2)探索语音与大模型结合的创新方向。

更新于 2025-05-01北京
logo of bytedance
社招3年以上A18766

1、负责核心算法研发: 1)负责语音识别(ASR)算法的设计与优化,构建高精度、低延时的语音处理系统; 2)主导语种识别(LID)、说话人分离(SSD)等语音相关技术的研发与落地; 3)深入探索Whisper/FunASR等开源语音项目,结合业务需求进行技术创新与改进; 2、负责技术应用与优化: 1)将语音算法应用于会议转录、实时字幕、语音消息等ToB办公场景; 2)优化语音模型在云端的推理性能,提升资源利用效率; 3)建设语音领域的高质量数据集及评测体系; 3、工程能力建设: 1)深入使用Python进行算法开发,熟练应用PyTorch/TensorFlow搭建训练Pipeline; 2)构建高性能推理框架,探索TensorRT/Triton/OnnxRuntime等加速工具的应用; 4、跨团队协作: 1)与产品团队合作挖掘用户需求,推动语音技术在产品中的创新应用; 2)与工程团队协作完成模型部署,解决端到端落地中的技术挑战; 5、技术前瞻性研究: 1)持续跟踪ICASSP/INTERSPEECH等顶会最新进展; 2)探索语音与大模型结合的创新方向。

更新于 2025-02-20上海
logo of baidu
社招ACG

-负责语音相关核心算法的研发与优化,包括但不限于:自动语音识别(ASR)、语音合成(TTS)与声音克隆、语音分类与建模 -构建语音模型的训练与推理框架,推动关键模型的稳定上线与效果持续迭代 -跟踪语音领域前沿研究,探索并推动前沿技术在实际业务中的落地应用 -参与多模态场景下语音能力的集成与调优,提升整体模型的智能感知与表达能力 -与产品、工程团队紧密协作,共同推进语音技术在智能客服、会议纪要、数字人等场景的应用落地

更新于 2025-07-31北京|上海