logo of honor

荣耀AI语音交互系统算法专家

社招全职5年以上研发类地点:北京 | 上海 | 西安状态:招聘

任职要求


1、计算机、人工智能、信号处理、模式识别、数学、声学等专业本科以上学历;
2、具备扎实的数学基础,具备数字信号处理等相关专业知识;
3、能够熟练使用至少1种编程语言,如:…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1、结合AI语音交互相关的业务(包含音频前端增强、声纹识别、命令词识别、唤醒),连接学术界和产业界,洞察未来业务方向,引导团队在AI语音交互方向做出有竞争力的算法方案;
2、对业界高校、三方公司在音频算法方向的技术发展进行深入洞察,推进技术合作;
3、布局、跟踪音频AI方向新技术,为产品算法的竞争力负责。
包括英文材料
模式识别+
学历+
C+
还有更多 •••
相关职位

logo of tongyi
社招3年以上技术类-算法

1. 负责通义实验室语音团队的语音处理算法研发,通过深入理解全链路技术挑战和推动语音前后端协作,不限于语音增强、回声消除、麦克风阵列(波束形成、声源定位等)、语音唤醒、多模检测、轻量化ASR/TTS/LLM等任务,打造行业领先的语音处理算法。 2. 持续关注行业前沿动态,通过专利申请、论文和技术报告等形式提升团队的技术影响力。

更新于 2025-11-01北京|杭州
logo of tongyi
社招3年以上技术类-算法

1. 负责通义实验室语音团队的语音处理算法研发,通过深入理解全链路技术挑战和推动语音前后端协作,不限于语音增强、回声消除、麦克风阵列(波束形成、声源定位等)、语音唤醒、多模检测、轻量化ASR/TTS/LLM等任务,打造行业领先的语音处理算法。 2. 持续关注行业前沿动态,通过专利申请、论文和技术报告等形式提升团队的技术影响力。

更新于 2025-12-05北京|杭州
logo of eleme
社招4年以上技术类-算法

1. 负责语音识别相关算法的研发与优化,包括唤醒词模型、ASR(自动语音识别)系统的性能提升; 2. 参与外呼场景中的语音交互系统建设,提升语音识别在复杂环境下的鲁棒性和准确率; 3. 结合大模型技术,探索语音识别与生成式AI的融合应用; 4. 研究并落地RAG(检索增强生成)技术在语音语义理解中的应用; 5. 探索基于Agent技术的智能语音交互架构,构建端到端的语音智能解决方案。

更新于 2025-10-16北京
logo of tongyi
社招3年以上技术类-算法

团队介绍: 我们是阿里巴巴通义实验室语音团队,在音频AI领域持续推动技术创新与产业落地。我们的成果包括: 1. ModelScope平台语音/音频板块核心算法团队 2. FunASR、CosyVoice、3D-Speaker等开源社区发起者与核心维护团队 3. 通义听悟(tingwu.aliyun.com)音频及语义算法团队 4. 阿里云智能语音交互及灵积语音模型服务核心算法提供方 岗位职责: 1. 主导多模态理解/音频大模型的前沿算法研究及产业落地。 2. 音频理解方向: (1)研发语音识别、语音翻译以及音频分析等理解算法。 (2)开发跨模态(语音/文本/视觉)的音频语义理解系统。 (3)探索音频大模型架构设计。 (4)推动算法成果转化:通过ModelScope开源社区创造研究价值,或通过阿里云产品体系创造商业价值。 (5)持续跟踪国际前沿技术动态(ICASSP/Interspeech/NeurIPS/ICLR等),参与国际会议、研讨会,与全球顶级团队进行交流合作。

更新于 2025-11-23北京|杭州