logo of changba

唱吧音频算法工程师(研究方向)

社招全职地点:北京状态:招聘

任职要求


了解基本乐理知识和声学知识。了解常用音频效果器,能够分析效果器的实现原理;
精通数字信号处理;
掌握matlabc/c++语言,能够快速实现音频算法;
扎实的中英…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


负责公司产品音质、音效分析。竞品音质、音效分析;
音频特效需求分析,制定音频特效方案;
研发音频特效产品;
音乐音频新技术研究探索;
包括英文材料
MATLAB+
C+
还有更多 •••
相关职位

logo of xiaohongshu
社招大模型

在算力驱动的 AGI 和人文精神的烟火气交汇之处,我们真诚邀请对大模型 Omni Model 有热情的同学加入,共同打造更具影响力的智能系统。你会成为团队的一员,并和其他同事协作,共同研发 SOTA 的 Omni Model。期待你以务实和客观的科学态度来推进技术的进展,不被过往经验裹挟、不被主观偏好影响。期待你除了算法外仍然是为出色的工程师。期待你对技术有强烈的好奇心和开放心态。 区别于传统 ASR / TTS 级联技术,我们希望打造端到端的 Omni Model 在实时交互中释放大模型的智力水平,彻底改变以 Chatbot 文字为主的人机交互界面 岗位说明:你会负责围绕大模型 Omni Model 构建语音模态的相关研究工作,包括但不限于如下事项 海量的语音数据处理和构建:定性分析、定量评估数据质量,并给出 scalable 的改进方案;探索跨模态(文字/视觉/语音)混合训练的最佳实践; 探索更加高效且合理的模型架构,让模型更加理解音频,同时让模型具备更好的语音合成能力 研究并探索基于 Omni Model 的 Post Train,包含但不限于 SFT 和 RL

北京|上海
logo of tencent
社招3年以上CSIG技术

1.负责实时互动 AI 对话技术的研究与开发,推动算法在语音识别、增强、理解、合成等方向的落地与优化; 2.跟踪学术界及行业最新研究动态,并结合业务需求优化现有算法,提升系统性能和用户体验。

更新于 2025-04-17北京
logo of baidu
社招MEG

-负责处理产品中音频、视频等内容的安全问题,包括但不限于色情、暴力等违规内容的识别与处理 -基于音频处理技术(如语音识别、声纹识别、音频分类等)和人工智能大模型,开发并落地内容安全检测模型,确保从海量音视频数据中高效识别风险内容 -研发和优化内容风控解决方案,分析违规数据的特点,并为平台提供全面的风控保障 -探索和应用前沿语音算法技术,方向涵盖但不限于语音识别、声纹识别、音频相似性匹配、多模态大模型等 -针对音频文件中的风险内容,深入研究并开发高效的自动化检测算法,提升风控系统的智能化与自动化水平

更新于 2024-11-14北京
logo of kuaishou
社招3-5年J0011

1、负责语音、音频和音乐相关算法的研究与开发,包括但不限于语音识别与合成、语音降噪/分离、音频分类、音乐识别等方向; 2、负责跟进行业前沿技术发展趋势,跟踪国际最新技术发展方向; 3、探索语音/音频/音乐技术落地新玩法,在音频AI理解和生成等方向进行业务创新。

更新于 2026-04-07北京