logo of dingtalk

钉钉钉钉-语音算法-工程师/专家

社招全职1年以上技术类-算法地点:杭州状态:招聘

任职要求


1. 背景要求: 计算机、电子工程、信号处理、人工智能等相关专业研究生及以上学历,具有 2年以上 语音算法相关从业经验;
2. 技术深度:
    ● 深厚的深度学习/机器学习功底,熟练掌握 PyTorch;
    ● 在语音识别、合成、声纹或情绪识别等至少一个领域有深入的研究或成功的工业界落地经验;
    ● 熟悉常用的语音信号处理算法(如降噪、回声消除、增益控制等)或特征提取技术;
3. 编程能力: 具备扎实的编程基础,熟练掌握 Python / C++,具备良好的…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


语音是人机交互中最自然、最便捷的模态。随着大模型时代的到来,语音AI的研究正从单一任务向多模态、高自然度交互演进。在阿里巴巴,我们的语音技术已深度植入流媒体、直播互动、智能客服、办公会议、AIoT及数字人等多元场景。我们正在寻找志同道合的伙伴,共同探索语音技术在复杂场景下的极限。在这里,你不仅能触达海量的真实数据,更能亲手打造影响亿万用户的交互体验。一段更具挑战、更有成就感的旅程正待开启!
岗位职责:
1. 核心算法研发: 负责语音信号处理领域的前沿算法研究与落地,包括但不限于语音识别(ASR)、语音合成(TTS)、说话人识别与分离(Speaker Verification/Diarization)、语音增强及端到端语音交互方案;
2. 专项技术突破:
    ● 声纹与属性识别: 负责声纹识别、语种识别以及情绪识别(Emotion Recognition)的算法优化,提升在真实业务场景下的识别精度与跨域泛化能力;
    ● 音频内容理解: 基于语义与声学特征,深度挖掘语音中的情感、意图及环境信息,赋能直播审核、内容分析等业务;
    ● AI-VAD: 研发基于深度学习的高鲁棒性语音活动检测(VAD)算法,解决强噪声、多语者叠加、远场等复杂环境下的起停点检测痛点;
3. 模型工程化落地: 推动算法在云端或端侧的部署优化,在保障性能(精度/鲁棒性)的同时,平衡算力消耗与推理延迟;
4. 技术预研: 跟踪并探索语音领域前沿技术(如大语言模型与语音的结合、Speech-to-Speech原生端到端交互等)。
包括英文材料
学历+
算法+
深度学习+
机器学习+
还有更多 •••
相关职位

logo of xpeng
社招

1.负责智能语音交互链路慢思考、大模型推理相关算法的研究和落地; 2.调研和实现大模型前沿算法,基于强化学习,思维链等方式,实践大模型逻辑推理能力在语音交互中落地; 3.承担智能语音链路慢思考相关的交互效果迭代; 4.负责智能语音算法组件的实现、封装、工程对接。与工程协作,完成算法模块的设计、开发、测试和优化工作;

更新于 2025-07-21北京
logo of tencent
社招TEG技术

1.负责大模型语音模态的设计、开发和优化,包括但不限于语音/音频数据清洗、模型设计、训练策略等方面的研究与应用; 2.参与语音识别、语音合成、声音克隆等相关大模型语音模态能力的建设,提高跨模态整体效果。

更新于 2025-06-10北京
logo of aliyun
社招技术类-算法

岗位职责: 该职位通过大模型训练、Agent、RAG、N2SQL、NLP、语音处理等技术创新和突破,构建Agent通用平台、大模型训练平台等工具产品,同时支持对话机器人等垂直应用及智能产品的建设。欢迎敢于接受挑战的候选人加入我们,一起赋能企业客户。我们的研究方向包括但不限于: 1、通用大模型、推理大模型预训练、微调、强化对齐等技术的持续研究创新; 2、多语言大模型、领域大模型的训练技术研究与落地; 3、AI数据清洗、加工、合成、自动标注技术研究与落地; 4、文本机器人、语音机器人、质检机器人等客服域技术的研发与落地; 5、多Agent、RAG、N2SQL、自主决策等技术的研究与落地; 6、入呼大模型机器人、外呼大模型机器人研发经验;熟悉VAD, ASR, TTS等语音相关技术; 以上方向擅长其中1个即可

更新于 2025-06-10北京|杭州
logo of vivo
社招5年以上研发类

岗位描述: 1、负责语音增强相关算法的研究、仿真和开发工作,包括但不限于麦克风阵列、回声消除、噪声抑制、端点检测等; 2、负责语音增强深度学习方向的技术研究及落地,结合传统信号处理优化复杂场景下的语音增强效果,提升AI语音产品的交互质量及用户体验; 3、负责将语音增强算法应用到手机终端,优化算法效果、计算性能、内存、功耗等指标; 4、探索语音增强技术前沿领域知识,跟进国际顶级学术界成果和工业界项目。

更新于 2025-06-25杭州