logo of dingtalk

钉钉AI算法工程师-音频方向

校招全职钉钉2026届秋季应届生招聘地点:杭州状态:招聘

任职要求


具体职责包括但不限于:
1、负责语音信号处理的相关算法研究和开发,包括语音识别TTS,说话人分离,说话人识别,语音增强,声音内容理解等;
2、负责语音识别/语音合成/声纹/语种/情感等方向的算法研究和开发;
3、负责口语语言理解/用户意图理解/对话模型/语音交互等算法研究和开发;

职位要求:
1、研究生及以上学历,人工智能、计算机、电子工程、机器学习、信号处理或其他相关专业;
2、熟练掌握至少一种编程语言,具备扎实的技术基础;
3、熟悉深度学习、信号处理、语音识别语音合成、口语语言处理、语音交互、人工智能等类似领域优先。

工作职责


语音是人人交流和人机交互中最自然、最便捷的模态,对语音AI的研究和应用已经成为人工智能领域的重要组成部分。在阿里巴巴,有关技术在流媒体播放、直播互动、智能客服、会议访谈、教育教学等场景,以及作为人机交互界面在AIoT、机器人、数字人等场景有广泛应用。

一段全新、有意思的旅程正待开启!为了更全面的展现你自己,你还可以在简历中附上你认为自己最有意思的爱好、特长、经历,或是对未来有意思的畅想,没有限制,此项非必填。加入我们,一起打开有意思的未来!
包括英文材料
算法+
语音识别+
学历+
机器学习+
深度学习+
语音识别+
语音合成+
相关职位

logo of oppo
校招AI/算法类

1.负责Android系统,音视频编解码与前后处理算法开发与研究 2.负责Android系统,音视频低功耗AI算法工程化开发与研究 3.负责音视频AI+混合编码、AI端到端编码算法的研究开发 4.负责音视频编码前处理、AI超分、AI SDR2HDR等算法的落地开发

更新于 2025-07-14
logo of oppo
校招AI/算法类

1. 参与大模型端到端的语音技术研发。 2. 参与语音技术前沿问题的探索与研究,结合实际应用场景,实现可落地语音技术解决方案。

更新于 2025-07-14
logo of xiaohongshu
校招多媒体算法

1、参与点,直播各场景音频算法,引擎和策略的研发,保障高质量的音频消费体验; 2、参与直播音频引擎的开发,包括音频采集,渲染和混音模块,在多平台完成集成和性能调优; 3、参与音频策略算法的研究,包括但不限于: ①语音降噪(Noise Suppression),回声消除(AEC)等3A算法 ②语音合成与修复等AI算法; ③抗丢包与弱网对抗技术(FEC、PLC)等编解码算法 4、跟踪业界前沿音频技术,参与3D 音效和空间音频等方向的调研与业务落地; 5、参与音频质量评测体系建设,配合进行主观/客观音质测试与问题定位。

更新于 2025-09-10
logo of xiaohongshu
校招多媒体算法

1、参与点,直播各场景音频算法,引擎和策略的研发,保障高质量的音频消费体验; 2、参与直播音频引擎的开发,包括音频采集,渲染和混音模块,在多平台完成集成和性能调优; 3、参与音频策略算法的研究,包括但不限于: ①语音降噪(Noise Suppression),回声消除(AEC)等3A算法 ②语音合成与修复等AI算法; ③抗丢包与弱网对抗技术(FEC、PLC)等编解码算法 4、跟踪业界前沿音频技术,参与3D 音效和空间音频等方向的调研与业务落地; 5、参与音频质量评测体系建设,配合进行主观/客观音质测试与问题定位。

更新于 2025-09-10