饿了么饿了么-语音识别算法专家-北京
社招全职4年以上技术类-算法地点:北京状态:招聘
任职要求
1. 计算机、人工智能、信号处理或相关专业硕士及以上学历; 2. 4年以上语音识别算法研发经验,熟悉主流ASR框架(如Kaldi、ESPnet、DeepSpeech等); 3. 具备扎实的深度学习基础,熟悉RNN、Transformer等在语音任务中的应用; 4. 熟悉大模型相关技术,有RAG、Agent架构实践经验者…
登录查看完整任职要求
微信扫码,1秒登录
工作职责
1. 负责语音识别相关算法的研发与优化,包括唤醒词模型、ASR(自动语音识别)系统的性能提升; 2. 参与外呼场景中的语音交互系统建设,提升语音识别在复杂环境下的鲁棒性和准确率; 3. 结合大模型技术,探索语音识别与生成式AI的融合应用; 4. 研究并落地RAG(检索增强生成)技术在语音语义理解中的应用; 5. 探索基于Agent技术的智能语音交互架构,构建端到端的语音智能解决方案。
包括英文材料
学历+
语音识别+
https://developer.nvidia.com/blog/essential-guide-to-automatic-speech-recognition-technology/
Over the past decade, AI-powered speech recognition systems have slowly become part of our everyday lives, from voice search to virtual assistants in contact centers, cars, hospitals, and restaurants.
算法+
https://roadmap.sh/datastructures-and-algorithms
Step by step guide to learn Data Structures and Algorithms in 2025
https://www.hellointerview.com/learn/code
A visual guide to the most important patterns and approaches for the coding interview.
https://www.w3schools.com/dsa/
深度学习+
https://d2l.ai/
Interactive deep learning book with code, math, and discussions.
RNN+
https://d2l.ai/chapter_recurrent-neural-networks/rnn.html
A neural network that uses recurrent computation for hidden states is called a recurrent neural network (RNN).
https://www.deeplearningbook.org/contents/rnn.html
Recurrent neural networks, or RNNs (Rumelhart et al., 1986a), are a family of neural networks for processing sequential data.
https://www.ibm.com/think/topics/recurrent-neural-networks
A recurrent neural network or RNN is a deep neural network trained on sequential or time series data to create a machine learning (ML) model that can make sequential predictions or conclusions based on sequential inputs.
Transformer+
https://huggingface.co/learn/llm-course/en/chapter1/4
Breaking down how Large Language Models work, visualizing how data flows through.
https://poloclub.github.io/transformer-explainer/
An interactive visualization tool showing you how transformer models work in large language models (LLM) like GPT.
https://www.youtube.com/watch?v=wjZofJX0v4M
Breaking down how Large Language Models work, visualizing how data flows through.
还有更多 •••
相关职位
社招2年以上技术类-算法
1. 负责语音识别和语音对话大模型的算法研发与优化,包括声学模型、LLM模型和解码器等,探索新的算法架构,建设高效率、低时延的语音应用系统; 2. 结合业务需求,持续改进现有模型的性能,确保其在不同应用场景下的准确性和鲁棒性,提升语音助手和语音智能体用户体验; 3. 构建和管理大规模语音识别和语音对话语料库,用于训练、验证和测试模型; 4. 跟踪前沿技术和研究动态,提出新颖的算法思路和解决方案。
更新于 2025-08-19北京|杭州
社招2年以上技术类-算法
1. 负责语音识别和语音对话大模型的算法研发与优化,包括声学模型、LLM模型和解码器等,探索新的算法架构,建设高效率、低时延的语音应用系统。 2. 结合业务需求,持续改进现有模型的性能,确保其在不同应用场景下的准确性和鲁棒性,提升语音助手和语音智能体用户体验。 3. 构建和管理大规模语音识别和语音对话语料库,用于训练、验证和测试模型。 4. 跟踪前沿技术和研究动态,提出新颖的算法思路和解决方案。
更新于 2025-11-26北京|杭州
社招1年以上技术类-算法
1.负责声学前端、声学模型、语言模型、后处理、解码器等主要模块的迭代和改进; 2.负责优化双工交互系统,提高系统的鲁棒性和性能; 3.负责优化语音识别大模型、流式语音识别、音频理解大模型、语音端到端大模型等; 4.追踪业界前沿的语音技术,探索语音大模型在业务场景下的应用。
更新于 2025-10-28北京|杭州