logo of transsion

传音资深语音信号处理算法工程师(J17388)

社招全职地点:上海状态:招聘

任职要求


具有计算机工程、感知科学、计算语言学、物理学、数学或者相关领域的硕士及以上学位;
具有团队管理经验者优先;
熟练的C/C++编程技巧,掌握一门脚本语言,如Python。具备将机器学习算法在不同的移动平台上进行移植适配,性能优化的能力;
对音频信号处理和内容分析有较好的研究和开发经验…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


研究和开发先进的语音信号处理算法,包括但不限于:语音回声消除、噪声抑制、声纹降噪、麦克风阵列技术等。
组织和协调团队成员紧密合作,完成产品开发和技术创新。
包括英文材料
学历+
C+
C+++
脚本+
Python+
还有更多 •••
相关职位

logo of transsion
社招2年以上

负责语音合成(TTS)核心算法的研发、性能优化与落地实现,推动TTS技术在实际产品中的应用; 结合业务规划,跟进学术界、行业最新的研究趋势,将预研成果落地于实际产品,并主导相关技术方案的制定和实施; 负责TTS相关技术难题的攻关,提升合成语音的自然度、表现力和鲁棒性; 指导和带领初级工程师,提升团队整体技术水平。

更新于 2025-02-22上海
logo of didi
社招3-5年技术

1、负责语音理解和语音生成算法在滴滴场景的落地使用 2、跟进最新技术,结合业务场景,提升语音识别、音频事件检测、声纹识别、语音合成等算法效果 3、探索语音大模型或多模态大模型在语音理解及语音生成场景的应用范式 4、算法优化,从模型架构、推理框架、量化压缩等角度提升模型推理速度、降低推理成本 Job Description 1. Responsible for the implementation of speech understanding and speech generation algorithms in Didi’s business scenarios. 2. Stay updated with the latest technologies and improve the performance of algorithms such as speech recognition, audio event detection, speaker recognition in real-world applications. 3. Explore the application paradigms of large language models or multimodal models in speech understanding and generation scenarios. 4. Optimize algorithms by enhancing inference speed and reducing costs through improvements in frameworks and quantization

更新于 2025-10-28北京
logo of didi
社招3-5年技术

1、负责语音理解和语音生成算法在滴滴场景的落地使用 2、跟进最新技术,结合业务场景,提升语音识别、音频事件检测、声纹识别、语音合成等算法效果 3、探索语音大模型或多模态大模型在语音理解及语音生成场景的应用范式

更新于 2025-10-09北京
logo of bytedance
社招A246507

1、负责公司音乐业务相关的音质音效开发与调优工作,相关研发技术在抖音、汽水音乐等产品中应用,满足音乐相关业务场景中用户不断增长的高阶听感的需求; 2、负责音乐产品(如流媒体平台、智能硬件、音乐制作工具等)的音频效果设计、调试与优化,包括EQ均衡、动态处理、空间混响等参数调整; 3、针对不同场景(如耳机/音箱播放、直播、车载环境)定制音效方案,确保听觉体验一致性与适应性; 4、与算法工程师合作,将音效参数转化为可落地的DSP(数字信号处理)代码或硬件调音方案; 5、研究用户听音习惯及行业趋势(如空间音频、AI生成音乐),提出创新音效功能设计(如自适应环境降噪、个性化声场调节); 6、通过A/B测试、用户反馈数据分析,持续迭代音效参数库与预设模板。

更新于 2025-03-17北京