logo of kuaishou

快手音频/音乐AIGC算法工程师-【可灵AI】

社招全职3-5年J0011地点:北京状态:招聘

任职要求


1、机器学习模式识别、信号处理等计算机相关专业的硕士或者博士;
2、有较丰富的语音/音频/音乐生成大模型相关领域经验;
3、熟练掌握C/C++、Python,有较强的代码实现能力;
4、具有独立解决问题的能力,良好的表达能力…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1、负责AI音频/音乐生成大模型关键算法研发和优化,包含但不局限于T2A、V2A和AI歌曲生成等方向;
2、负责跟进行业前沿技术发展趋势,跟踪国际最新技术发展方向;
3、推动音频/音乐AIGC技术在快手各业务场景中的落地,探索音频/音乐生成技术在业务中的新玩法和业务创新。
包括英文材料
机器学习+
模式识别+
大模型+
C+
C+++
还有更多 •••
相关职位

logo of kuaishou
社招3-5年J0012

音视频生成大模型评测体系建设与演进及业务保障,负责包括但不限于视频生成大模型中音频生成模块(Audio Gen)及音视频一体化的算法效果。不仅是评测的执行者,更是评测体系的架构师,通过深度的算法归因分析,驱动音频 VAE等核心组件的算法优化和迭代。 1、音视频一体化评测体系建设: 1)音频生成与音频理解相关算法、评测方法及评测指标体系具有深入理解,熟悉常见视频与音频质量评估方法,能够结合业务场景设计合理的评测方案; 2)建立从底层算子(VAE, Latent Space)到上层生成效果的全链路评测标准; 3)定义并量化音画同步性、语义关联度、音频美学表现力等关键维度; 2、Benchmark 与方法论沉淀: 1)构建具有行业领先水平的音频生成 Benchmark,涵盖音乐、环境音、音效(SFX)及人声等; 2)沉淀主客观结合的评测方法论,包括客观指标(FAD、KL Divergence、IS、CLAP Score)与专家级主观评价量表(MOS, MUSHRA); 3、深度诊断与归因分析:输出专业评测报告,深度分析,定位模型缺陷,如针对音频 VAE 压缩失真、音频扩散模型频谱缺失、相位扭曲等问题进行深度诊断,并给出改进建议; 4、前瞻性调研与实验:持续跟踪 AIGC 领域(如 ElevenLabs、Suno、Stable Audio等)前沿技术动态,将行业最新的模型能力和技术路线转化为可落地的评测方案; 5、评测工具与平台化驱动:参与或主导自动化评测工具与平台的开发,利用技术手段提升大规模音视频数据的评测效率,探索基于大模型的自监督评测(LLM-as-a-judge)等创新手段。

更新于 2026-03-25北京
logo of kuaishou
校招J1010

1、负责AI音频/音乐生成大模型关键算法研发和优化,包含但不局限于T2A、V2A和AI歌曲生成等方向; 2、负责跟进行业前沿技术发展趋势,跟踪国际最新技术发展方向; 3、推动音频/音乐AIGC技术在快手各业务场景中的落地,探索音频/音乐生成技术在业务中的新玩法和业务创新。

更新于 2026-03-20北京
logo of kuaishou
校招J1010

1、负责AI音频/音乐生成大模型关键算法研发和优化,包含但不局限于T2A、V2A和AI歌曲生成等方向; 2、负责跟进行业前沿技术发展趋势,跟踪国际最新技术发展方向; 3、推动音频/音乐AIGC技术在快手各业务场景中的落地,探索音频/音乐生成技术在业务中的新玩法和业务创新。

更新于 2025-07-30北京
logo of kuaishou
实习J1010

1、负责AI音频/音乐生成大模型关键算法研发和优化,包含但不局限于T2A、V2A和AI歌曲生成等方向; 2、负责跟进行业前沿技术发展趋势,跟踪国际最新技术发展方向; 3、推动音频/音乐AIGC技术在快手各业务场景中的落地,探索音频/音乐生成技术在业务中的新玩法和业务创新。

更新于 2025-05-08北京