传音算法工程师-语音识别-上海(J18486)
校招全职地点:上海状态:招聘
任职要求
1. 硕士及以上学历,计算机技术相关专业背景; 2. 熟悉常见的语音识别,如Wenet,whisper或Kaldi框架,成功主持过实际项目落地; 3. 深入了解语音信号处理,熟悉与语音识别相关的前端信号处理性能评价方法,能与前端联合调优; 4. 精通Tensorflow,Pytorch等工具; 5. 在相关国际会议或期刊(ICASSP、INTERSPEECH、 ASRU、 TASLP、 Speech Communication)发表过论文者优先。
工作职责
1. 负责小语种小样本数据情况下的语音识别算法的研究和开发,涉及声学模型、语言模型及解码器等; 2. 负责语音识别模型的压缩和离线解码器的开发和优化; 3. 针对不同的用户使用场景,优化语音识别性能,提升用户语音交互体验; 4. 跟踪国内外语音识别相关领域的前沿进展,保持技术的领先;
包括英文材料
学历+
语音识别+
https://www.youtube.com/watch?v=mYUyaKmvu6Y
Learn how to implement speech recognition in Python by building five projects.
https://www.youtube.com/watch?v=sR6_bZ6VkAg
How Rev.com harnesses human-in-the-loop and deep learning to build the world's best English speech recognition engine
TensorFlow+
https://www.youtube.com/watch?v=tpCFfeUEGs8
Ready to learn the fundamentals of TensorFlow and deep learning with Python? Well, you’ve come to the right place.
https://www.youtube.com/watch?v=ZUKz4125WNI
This part continues right where part one left off so get that Google Colab window open and get ready to write plenty more TensorFlow code.
PyTorch+
https://datawhalechina.github.io/thorough-pytorch/
PyTorch是利用深度学习进行数据科学研究的重要工具,在灵活性、可读性和性能上都具备相当的优势,近年来已成为学术界实现深度学习算法最常用的框架。
https://www.youtube.com/watch?v=V_xro1bcAuA
Learn PyTorch for deep learning in this comprehensive course for beginners. PyTorch is a machine learning framework written in Python.
相关职位
校招
1. 负责语音助手任务域的研发工作,包括意图识别、槽位填充、对话管理等核心模块的开发与优化。 2. 负责升级语音助手agent架构,集成并应用大语言模型(LLM)、多模态大语言模型、检索增强生成(RAG)技术及各类工具,以提升智能助手的整体性能和用户体验。 3. 负责搭建线上数据闭环系统,通过数据收集、分析和反馈,持续优化和提升线上效果。 4. 确保以上所有任务和项目的实施支持多语言,并实现端云融合,提供跨语言和跨平台的智能服务。
更新于 2025-08-18
实习算法
1. 参与多模态大模型语音方向的研发工作,包括但不限于语音识别、音频理解、声音事件检测、语音端到端对话等 2. 负责多模态大模型前沿算法的探索 3. 负责多模态大模型相关数据的清洗、扩增,提升数据质量 4. 参与多模态大模型的训练、优化和测试,提升模型的性能和稳定性 5. 协助团队完成相关项目的开发和落地,实现技术成果的转化
更新于 2025-07-02