logo of transsion

传音算法工程师-语音识别-上海(J18486)

校招全职地点:上海状态:招聘

任职要求


1. 硕士及以上学历,计算机技术相关专业背景;
2. 熟悉常见的语音识别,如Wenet,whisper或Kaldi框架,成功主持过实际项目落地;
3. 深入了解语音信号处理,熟悉与语音识别相关的前端信号处理性能评价方法,能与前端联合调优;
4. 精通TensorflowPytorch等工具;
5. 在相关国际会议或期刊(ICASSP、INTERSPEECH、 ASRU、 TASLP、 Speech Communication)发表过论文者优先。

工作职责


1. 负责小语种小样本数据情况下的语音识别算法的研究和开发,涉及声学模型、语言模型及解码器等;
2. 负责语音识别模型的压缩和离线解码器的开发和优化;
3. 针对不同的用户使用场景,优化语音识别性能,提升用户语音交互体验;
4. 跟踪国内外语音识别相关领域的前沿进展,保持技术的领先;
包括英文材料
学历+
语音识别+
TensorFlow+
PyTorch+
相关职位

logo of transsion
校招

1. 负责语音助手任务域的研发工作,包括意图识别、槽位填充、对话管理等核心模块的开发与优化。 2. 负责升级语音助手agent架构,集成并应用大语言模型(LLM)、多模态大语言模型、检索增强生成(RAG)技术及各类工具,以提升智能助手的整体性能和用户体验。 3. 负责搭建线上数据闭环系统,通过数据收集、分析和反馈,持续优化和提升线上效果。 4. 确保以上所有任务和项目的实施支持多语言,并实现端云融合,提供跨语言和跨平台的智能服务。

更新于 2025-08-18
logo of meituan
实习核心本地商业-基

负责语音识别/语音合成/声纹识别等技术方向的算法研究和开发工作,负责将前沿语音算法落地到美团业务场景并取得应用效果。

更新于 2025-02-26
logo of nio
实习算法

1. 参与多模态大模型语音方向的研发工作,包括但不限于语音识别、音频理解、声音事件检测、语音端到端对话等 2. 负责多模态大模型前沿算法的探索 3. 负责多模态大模型相关数据的清洗、扩增,提升数据质量 4. 参与多模态大模型的训练、优化和测试,提升模型的性能和稳定性 5. 协助团队完成相关项目的开发和落地,实现技术成果的转化

更新于 2025-07-02
logo of bytedance
社招JR6DP

1、支持语音识别技术在字节跳动公司内外丰富的业务场景落地,解决落地过程中的前沿问题,持续优化语音识别核心技术效果; 2、搭建音频理解核心技术体系,专注语音识别的前沿技术和算法效果,追求和探索业界最前沿算法。

更新于 2021-03-29