logo of wondershare

万兴科技AI音频评测工程师

社招全职1年以上地点:长沙状态:招聘

任职要求


必备条件
1、1年以上音乐制作/音效设计经验,熟悉AI音频工具(Suno/ElevenLabs/ MusicFX)
2、能拆解音乐风格特征(流行/电子等)并转化为模型控制参数
3、具备基础音频分析能力(如频谱/波形诊断)

加分项(满足1项即可)
1、参与过AI音乐生成项目,了解Diffusion/Transformer原理
2、掌握DAW工具(Logic Pro/Ableton)或音频合成技术
3、熟悉TTS/ASR技术栈或有相关测试经验

工作职责


1. 参与语音/音乐/音效生成模型效果的效果评估标准建立(如语音自然度、清晰度、情绪表达);
2. 标注效果评测过程的音频错误(口音偏移、节奏突变、情绪不到位、语音断裂等);
3. 设计与执行主观打分测试(MOS)、音频AB测试、风格对比测试;
4. 管理评估音频测试集,保证语种、风格、情绪维度覆盖全面;
5. 协助产品和算法团队优化音频生成偏好/异常反馈链路。
包括英文材料
Transformer+
语音合成+
语音识别+
相关职位

logo of bytedance
校招A160522

团队介绍:语音团队致力于语音、音频、音乐等大模型AIGC技术的研发和产品创新,我们的使命是通过多模态AIGC音频技术赋能内容创作与语音交互,让内容生产、消费与互动变得简单、沉浸、多元化。当前团队已有成熟的语音生成、声音克隆、音频理解与处理、音乐理解和生成等领域的技术,一方面以中台形式服务于公司众多业务线,另一方面,通过火山引擎开放平台-AI中台-音频技术、商用音乐平台-易颂等,向众多企业开放技术成熟稳定的能力和服务。 1、负责字节跳动语音相关产品的TTS、ASR、多模态交互模型等场景的效果评估,站在用户视角构建端到端的算法效果评测体系; 2、深入业务结合业务需求痛点,设计完备的算法效果质量保障、评测方案;构建合理且置信的标准化评测体系,解决业务评测效率和效果问题; 3、推动通用人工智能评测方案的升级迭代,逐步推广至公司内的商业化平台。

更新于 2025-07-31
logo of xiaohongshu
校招多媒体算法

1、参与点,直播各场景音频算法,引擎和策略的研发,保障高质量的音频消费体验; 2、参与直播音频引擎的开发,包括音频采集,渲染和混音模块,在多平台完成集成和性能调优; 3、参与音频策略算法的研究,包括但不限于: ①语音降噪(Noise Suppression),回声消除(AEC)等3A算法 ②语音合成与修复等AI算法; ③抗丢包与弱网对抗技术(FEC、PLC)等编解码算法 4、跟踪业界前沿音频技术,参与3D 音效和空间音频等方向的调研与业务落地; 5、参与音频质量评测体系建设,配合进行主观/客观音质测试与问题定位。

更新于 2025-09-10
logo of mi
校招

1. 跟进行业空间音频前沿技术发展趋势; 2. 参与空间音频技术规划; 3. 负责空间音频算法开发和技术预研。 【课题名称】 空间音频算法研发 【课题内容】 1. 空间声拾取及后处理技术研究; 2. 空间声场建模与主动控制技术研究; 3. 空间音频质量评测模型研究。

更新于 2025-06-25
logo of xiaohongshu
校招多媒体算法

1、参与点,直播各场景音频算法,引擎和策略的研发,保障高质量的音频消费体验; 2、参与直播音频引擎的开发,包括音频采集,渲染和混音模块,在多平台完成集成和性能调优; 3、参与音频策略算法的研究,包括但不限于: ①语音降噪(Noise Suppression),回声消除(AEC)等3A算法 ②语音合成与修复等AI算法; ③抗丢包与弱网对抗技术(FEC、PLC)等编解码算法 4、跟踪业界前沿音频技术,参与3D 音效和空间音频等方向的调研与业务落地; 5、参与音频质量评测体系建设,配合进行主观/客观音质测试与问题定位。

更新于 2025-09-10