万兴科技AI音频评测工程师

社招全职1年以上2025-07-08地点：长沙状态：招聘

扫码手机上打开

任职要求

必备条件
1、1年以上音乐制作/音效设计经验，熟悉AI音频工具（Suno/ElevenLabs/ MusicFX）
2、能拆解音乐风格特征（流行/电子等）并转化为模型控制参数
3、具备基础音频分析能力（如频谱/波形诊断）
…

登录查看完整任职要求

微信扫码，1秒登录

工作职责

1. 参与语音/音乐/音效生成模型效果的效果评估标准建立（如语音自然度、清晰度、情绪表达）；
2. 标注效果评测过程的音频错误（口音偏移、节奏突变、情绪不到位、语音断裂等）；
3. 设计与执行主观打分测试（MOS）、音频AB测试、风格对比测试；
4. 管理评估音频测试集，保证语种、风格、情绪维度覆盖全面；
5. 协助产品和算法团队优化音频生成偏好/异常反馈链路。

📮 投递简历 ✨AI模拟面试

难度：

包括英文材料

Transformer+

还有更多 •••

登录查看完整学习资料

相关职位

音频大模型评测工程师-【可灵AI专项】

社招3-5年J0012

音视频生成大模型评测体系建设与演进及业务保障，负责包括但不限于视频生成大模型中音频生成模块（Audio Gen）及音视频一体化的算法效果。不仅是评测的执行者，更是评测体系的架构师，通过深度的算法归因分析，驱动音频 VAE等核心组件的算法优化和迭代。 1、音视频一体化评测体系建设： 1）音频生成与音频理解相关算法、评测方法及评测指标体系具有深入理解，熟悉常见视频与音频质量评估方法，能够结合业务场景设计合理的评测方案； 2）建立从底层算子（VAE, Latent Space）到上层生成效果的全链路评测标准； 3）定义并量化音画同步性、语义关联度、音频美学表现力等关键维度； 2、Benchmark 与方法论沉淀： 1）构建具有行业领先水平的音频生成 Benchmark，涵盖音乐、环境音、音效（SFX）及人声等； 2）沉淀主客观结合的评测方法论，包括客观指标（FAD、KL Divergence、IS、CLAP Score）与专家级主观评价量表（MOS, MUSHRA）； 3、深度诊断与归因分析：输出专业评测报告，深度分析，定位模型缺陷，如针对音频 VAE 压缩失真、音频扩散模型频谱缺失、相位扭曲等问题进行深度诊断，并给出改进建议； 4、前瞻性调研与实验：持续跟踪 AIGC 领域（如 ElevenLabs、Suno、Stable Audio等）前沿技术动态，将行业最新的模型能力和技术路线转化为可落地的评测方案； 5、评测工具与平台化驱动：参与或主导自动化评测工具与平台的开发，利用技术手段提升大规模音视频数据的评测效率，探索基于大模型的自监督评测（LLM-as-a-judge）等创新手段。

更新于 2026-03-25北京

AI音频美学工程（可灵AI专项）

社招3-5年D13923

1、负责AI音频美学研究与标准化：构建AI音频的审美评价体系，参与多模态美学模型的感知层训练与标注策略制定，建立音频生成质量的主观与客观评测指标； 2、负责音频生成与算法协同：与算法团队协作，优化音乐生成，调参与分析音频模型的声学特征； 3、负责听觉体验与叙事美学设计：分析并优化AI生成视频/动画/虚拟角色中的声音叙事逻辑与声画关系，研究听觉情绪曲线、音调与光影/色彩的匹配策略，指导AI模型在不同文化语境下的声音审美适配； 4、负责跨团队协作与创新实验：构建AI音频Demo，输出可视化/听化展示材料，参与跨媒体创意实验（如AI音乐短片、虚拟人声表演、AI拟声叙事剧等）。

更新于 2025-10-21北京

AI+音频产品线资深产品经理

社招3-5年新浪&微博

**** 1. **核心产品设计与管理：**主导新产品/新功能的设计与搭建,负责产品生命周期的规划、落地和持续优化。 2. **大模型能力评估与集成：**深入研究国内外主流大模型(LLM/多模态模型)的优劣势、接口能力和最佳实践。结合产品需求,评估并选择最适合的底层模型,设计高效的集成方案。 3. **提示词工程与效能优化(核心)：**负责核心AI功能的提示词工程设计、撰写、测试和持续迭代,最大化大模型在音频处理、内容生成等场景下的输出质量与效率。 4. **C端用户增长策略：**设计并推动C端APP的用户增长策略,包括基于AI能力的用户留存和分享机制设计、数据驱动的功能优化,推动产品在早期市场的传播增长； 5. **前沿跟踪与跨团队赋能：**跟进国内外AI生成模型及产品的最新动态,对AIGC领域的技术产品、应用趋势进行市场调研和分析。 **

更新于 2025-10-20北京

音频AI算法工程师

社招A97705A

1. 负责AI降噪、AI回声消除、AI音频检测等算法的设计、训练和调优；满足耳机、手表等端侧设备实时通话、录音、音效、场景分类、伴奏分离等AI需求； 2. 负责网络模型的轻量化，运用量化、剪枝、蒸馏等技术降低模型尺寸与算力消耗，确保在端侧的兼容性与运行效率； 3. 协助搭建前端音频处理链路，利用AI模型，整合阵列、波束等，解决复杂环境下（如噪声、混响、多说话人）的音频质量问题；探索音效链路中AI技术应用；

更新于 2025-11-20北京