logo of eleme

饿了么饿了么-语音识别算法专家-北京

社招全职4年以上技术类-算法地点:北京状态:招聘

任职要求


1. 计算机、人工智能、信号处理或相关专业硕士及以上学历;
2. 4年以上语音识别算法研发经验,熟悉主流ASR框架(如Kaldi、ESPnet、DeepSpeech等);
3. 具备扎实的深度学习基础,熟悉RNNTransformer等在语音任务中的应用;
4. 熟悉大模型相关技术,有RAG、Agent架构实践经验者…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1. 负责语音识别相关算法的研发与优化,包括唤醒词模型、ASR(自动语音识别)系统的性能提升;
2. 参与外呼场景中的语音交互系统建设,提升语音识别在复杂环境下的鲁棒性和准确率;
3. 结合大模型技术,探索语音识别与生成式AI的融合应用;
4. 研究并落地RAG(检索增强生成)技术在语音语义理解中的应用;
5. 探索基于Agent技术的智能语音交互架构,构建端到端的语音智能解决方案。
包括英文材料
学历+
语音识别+
算法+
深度学习+
RNN+
Transformer+
还有更多 •••
相关职位

logo of quark
社招2年以上技术类-算法

1. 负责语音识别和语音对话大模型的算法研发与优化,包括声学模型、LLM模型和解码器等,探索新的算法架构,建设高效率、低时延的语音应用系统; 2. 结合业务需求,持续改进现有模型的性能,确保其在不同应用场景下的准确性和鲁棒性,提升语音助手和语音智能体用户体验; 3. 构建和管理大规模语音识别和语音对话语料库,用于训练、验证和测试模型; 4. 跟踪前沿技术和研究动态,提出新颖的算法思路和解决方案。

更新于 2025-08-19北京|杭州
logo of tongyi
社招2年以上技术类-算法

1. 负责语音识别和语音对话大模型的算法研发与优化,包括声学模型、LLM模型和解码器等,探索新的算法架构,建设高效率、低时延的语音应用系统。 2. 结合业务需求,持续改进现有模型的性能,确保其在不同应用场景下的准确性和鲁棒性,提升语音助手和语音智能体用户体验。 3. 构建和管理大规模语音识别和语音对话语料库,用于训练、验证和测试模型。 4. 跟踪前沿技术和研究动态,提出新颖的算法思路和解决方案。

更新于 2025-11-26北京|杭州
logo of quark
社招1年以上技术类-算法

1.负责声学前端、声学模型、语言模型、后处理、解码器等主要模块的迭代和改进; 2.负责优化双工交互系统,提高系统的鲁棒性和性能; 3.负责优化语音识别大模型、流式语音识别、音频理解大模型、语音端到端大模型等; 4.追踪业界前沿的语音技术,探索语音大模型在业务场景下的应用。

更新于 2025-10-28北京|杭州
logo of alibaba
社招2年以上

1、 参与语音大模型的研发,包括语音识别、语音合成、音色克隆、端到端合成等技术; 2、探索歌曲、音乐等音频的理解与合成技术; 3、打造全模态的大模型; 4、将以上技术落地到淘天业务,考虑模型性能与效率。

更新于 2025-07-01北京|杭州