快手音频/音乐AIGC算法工程师-【可灵AI】

社招全职3-5年J00112026-04-07地点：北京状态：招聘

扫码手机上打开

任职要求

1、机器学习、模式识别、信号处理等计算机相关专业的硕士或者博士；
2、有较丰富的语音/音频/音乐生成大模型相关领域经验；
3、熟练掌握C/C++、Python，有较强的代码实现能力；
4、具有独立解决问题的能力，良好的表达能力…

登录查看完整任职要求

微信扫码，1秒登录

工作职责

1、负责AI音频/音乐生成大模型关键算法研发和优化，包含但不局限于T2A、V2A和AI歌曲生成等方向；
2、负责跟进行业前沿技术发展趋势，跟踪国际最新技术发展方向；
3、推动音频/音乐AIGC技术在快手各业务场景中的落地，探索音频/音乐生成技术在业务中的新玩法和业务创新。

📮 投递简历 ✨AI模拟面试

难度：

包括英文材料

机器学习+

模式识别+

大模型+

C+

C+++

还有更多 •••

登录查看完整学习资料

相关职位

音频大模型评测工程师-【可灵AI专项】

社招3-5年J0012

音视频生成大模型评测体系建设与演进及业务保障，负责包括但不限于视频生成大模型中音频生成模块（Audio Gen）及音视频一体化的算法效果。不仅是评测的执行者，更是评测体系的架构师，通过深度的算法归因分析，驱动音频 VAE等核心组件的算法优化和迭代。 1、音视频一体化评测体系建设： 1）音频生成与音频理解相关算法、评测方法及评测指标体系具有深入理解，熟悉常见视频与音频质量评估方法，能够结合业务场景设计合理的评测方案； 2）建立从底层算子（VAE, Latent Space）到上层生成效果的全链路评测标准； 3）定义并量化音画同步性、语义关联度、音频美学表现力等关键维度； 2、Benchmark 与方法论沉淀： 1）构建具有行业领先水平的音频生成 Benchmark，涵盖音乐、环境音、音效（SFX）及人声等； 2）沉淀主客观结合的评测方法论，包括客观指标（FAD、KL Divergence、IS、CLAP Score）与专家级主观评价量表（MOS, MUSHRA）； 3、深度诊断与归因分析：输出专业评测报告，深度分析，定位模型缺陷，如针对音频 VAE 压缩失真、音频扩散模型频谱缺失、相位扭曲等问题进行深度诊断，并给出改进建议； 4、前瞻性调研与实验：持续跟踪 AIGC 领域（如 ElevenLabs、Suno、Stable Audio等）前沿技术动态，将行业最新的模型能力和技术路线转化为可落地的评测方案； 5、评测工具与平台化驱动：参与或主导自动化评测工具与平台的开发，利用技术手段提升大规模音视频数据的评测效率，探索基于大模型的自监督评测（LLM-as-a-judge）等创新手段。

更新于 2026-03-25北京

音频/音乐AIGC算法工程师

校招J1010

1、负责AI音频/音乐生成大模型关键算法研发和优化，包含但不局限于T2A、V2A和AI歌曲生成等方向； 2、负责跟进行业前沿技术发展趋势，跟踪国际最新技术发展方向； 3、推动音频/音乐AIGC技术在快手各业务场景中的落地，探索音频/音乐生成技术在业务中的新玩法和业务创新。

更新于 2026-03-20北京

【快Star-X】音频/音乐AIGC算法工程师

校招J1010

更新于 2025-07-30北京

【快Star-X实习】音频/音乐AIGC算法工程师

实习J1010

更新于 2025-05-08北京