logo of sensetime

商汤语音算法工程师

社招全职算法研究地点:北京 | 深圳状态:招聘

任职要求


1.人工智能、机器学习、信号处理或计算机科学等相关专业研究生以上学历,基础扎实
2.熟悉主流的语音识别模型算法,如RNN-T、conformer、CTC
3.熟悉kaldi / K2 / wenet / espnet / whisper / FunASR 中至少两种工具
4.学习研究能力强,能够独立阅读英文文献,对解决具有挑战性的问题充满激情
5.具有扎实的机器学习理论基础,优秀的算法实现能力,熟练使用 PyTorch深度学习框架,掌握SSL、LLM、diffusion、对比学习等机器学习技术在音频生成领域的应用;
6.具有…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1. 负责多模态语音交互场景下的语音理解、语音生成和语音交互大模型的算法研发、性能优化与落地实现;
2.负责数字人场景下的个性化实时情感对话语音合成、低资源音色克隆、语音识别、语音增强、语音检测、语种识别、声纹识别、说话人分割、变声、音乐生成等技术研发;
3.负责语音相关算法引擎的流式改造、推理优化、大并发低延迟云服务、私有化服务定制开发;
4.跟进学术界、行业最新的研究趋势,产出新的科研成果,并落地于实际产品。
包括英文材料
机器学习+
学历+
语音识别+
算法+
RNN+
PyTorch+
深度学习+
大模型+
还有更多 •••
相关职位

logo of aliyun
社招技术类-算法

岗位职责: 该职位通过大模型训练、Agent、RAG、N2SQL、NLP、语音处理等技术创新和突破,构建Agent通用平台、大模型训练平台等工具产品,同时支持对话机器人等垂直应用及智能产品的建设。欢迎敢于接受挑战的候选人加入我们,一起赋能企业客户。我们的研究方向包括但不限于: 1、通用大模型、推理大模型预训练、微调、强化对齐等技术的持续研究创新; 2、多语言大模型、领域大模型的训练技术研究与落地; 3、AI数据清洗、加工、合成、自动标注技术研究与落地; 4、文本机器人、语音机器人、质检机器人等客服域技术的研发与落地; 5、多Agent、RAG、N2SQL、自主决策等技术的研究与落地; 6、入呼大模型机器人、外呼大模型机器人研发经验;熟悉VAD, ASR, TTS等语音相关技术; 以上方向擅长其中1个即可

更新于 2025-06-10北京|杭州
logo of baidu
社招ACG

-负责语音信号处理算法的研究、设计、开发和优化,包括但不限于特征提取、降噪、回声消除等 -参与语音识别算法的研发,提高识别准确率和识别速度 -负责语音合成算法的开发,优化语音生成的音质和流畅度 -跟踪语音技术领域的最新动态,研究新技术和新算法,为公司技术储备提供支持 -与其他技术栈紧密合作,确保语音算法在公司产品中的有效应用 -编写相关技术文档,包括算法设计文档、测试报告、使用说明等

更新于 2025-04-21上海
logo of baidu
社招ACG

-负责语音信号处理算法的研究、设计、开发和优化,包括但不限于特征提取、降噪、回声消除等 -参与语音识别算法的研发,提高识别准确率和识别速度 -负责语音合成算法的开发,优化语音生成的音质和流畅度 -跟踪语音技术领域的最新动态,研究新技术和新算法,为公司技术储备提供支持 -与其他技术栈紧密合作,确保语音算法在公司产品中的有效应用 -编写相关技术文档,包括算法设计文档、测试报告、使用说明等

更新于 2025-04-17上海
logo of baidu
社招MEG

-负责处理产品中音频、视频等内容的安全问题,包括但不限于色情、暴力等违规内容的识别与处理 -基于音频处理技术(如语音识别、声纹识别、音频分类等)和人工智能大模型,开发并落地内容安全检测模型,确保从海量音视频数据中高效识别风险内容 -研发和优化内容风控解决方案,分析违规数据的特点,并为平台提供全面的风控保障 -探索和应用前沿语音算法技术,方向涵盖但不限于语音识别、声纹识别、音频相似性匹配、多模态大模型等 -针对音频文件中的风险内容,深入研究并开发高效的自动化检测算法,提升风控系统的智能化与自动化水平

更新于 2024-11-14北京