快手音频大模型评测工程师-【可灵AI专项】
任职要求
1、专业功底: 1)本科及以上学历,有音频相关经验或学历:计算机、人工智能、数字媒体技术、录音工程、音乐制作、音响导演、音频编辑、音乐工程等专业优先。 2)具备同期录音、后期混音、配乐制作或SDK声学调校、音质评价等相关领域的学习背景或实践经验,对音频质量的主客观评价有一定的了解; 3)熟悉主观音质评价体系,对于各类音频的听评标准有敏感性,有金耳朵认证者优先; 4)音/视频生成领域评测方法与指标体系有系统研究或实践经验,有音频类算法评测经验优先(包括TTS、文生音频、V2A、音视频一体化模型等),对常见算法模型及生成模型原理有较好理解,熟悉机器学习模型评估方法与指标,对音视频生成算法原理(如 Diffusion、Transformer、GAN)有较好理解。 2、评测经验: 1…
工作职责
音视频生成大模型评测体系建设与演进及业务保障,负责包括但不限于视频生成大模型中音频生成模块(Audio Gen)及音视频一体化的算法效果。不仅是评测的执行者,更是评测体系的架构师,通过深度的算法归因分析,驱动音频 VAE等核心组件的算法优化和迭代。 1、音视频一体化评测体系建设: 1)音频生成与音频理解相关算法、评测方法及评测指标体系具有深入理解,熟悉常见视频与音频质量评估方法,能够结合业务场景设计合理的评测方案; 2)建立从底层算子(VAE, Latent Space)到上层生成效果的全链路评测标准; 3)定义并量化音画同步性、语义关联度、音频美学表现力等关键维度; 2、Benchmark 与方法论沉淀: 1)构建具有行业领先水平的音频生成 Benchmark,涵盖音乐、环境音、音效(SFX)及人声等; 2)沉淀主客观结合的评测方法论,包括客观指标(FAD、KL Divergence、IS、CLAP Score)与专家级主观评价量表(MOS, MUSHRA); 3、深度诊断与归因分析:输出专业评测报告,深度分析,定位模型缺陷,如针对音频 VAE 压缩失真、音频扩散模型频谱缺失、相位扭曲等问题进行深度诊断,并给出改进建议; 4、前瞻性调研与实验:持续跟踪 AIGC 领域(如 ElevenLabs、Suno、Stable Audio等)前沿技术动态,将行业最新的模型能力和技术路线转化为可落地的评测方案; 5、评测工具与平台化驱动:参与或主导自动化评测工具与平台的开发,利用技术手段提升大规模音视频数据的评测效率,探索基于大模型的自监督评测(LLM-as-a-judge)等创新手段。
1、参与大模型数据平台架构设计与开发,为大模型数据资产建设管理提供平台支持,支持数据资产上架、知识生产、检索、训练应用等;数据用途上包含预训练数据、微调数据、评测数据等,数据模态上包含文本、图片、视频、音频等各类模态数据。 2、参与高可用、可扩展、分布式大模型评测平台架构设计与开发,支持多模型、多方法、多评测集的评测任务执行、评测结果分析,优化评测框架,提升评测效率,支持实现大模型快速迭代的评测要求。 3、在通用BenchMark基础上构建业务领域Benchmark,围绕“语料供给-模型迭代-模型评测”的链路不断优化链路,提升生产效率。 4、持续的创新和优化能力,提升产品整体质量,改善用户体验。
- 参与大模型数据策略与数据迭代(文本/多模态/代码),负责大规模数据构建与合成,支撑预训练/对齐效果 - 协助多模态、代码与工具调用数据的构建,进行包括分布式的清洗、合成、近重复/噪声检测与去重,建立难例库与反馈闭环,持续提升数据质量与密度 - 参与数据质量评估与筛选算法的实现:低质过滤,质量评分、LLM判别与复核等;针对代码与工具调用场景,引入编译/单测/沙箱执行/参数一致性校验 - 支持对齐与偏好学习数据,配合消融实验及评测指标分析,输出采样/准入/退场/权重等数据策略并推动落地
企业级 AI 方案设计与落地:围绕财务自动化、人力智能决策、法务风险洞察、研发提效等核心场景,主导从 0 → 1 的大模型应用规划、可行性分析与实施。前沿大模型应用研发:深入参与代码生成、AI-BI、企业知识问答、多模态 AIGC(图像 / 文本 / 语音 / 视频)等方向的系统设计与算法优化,推动产品化交付。模型全生命周期训练:负责预训练、指令微调、强化学习(如 DPO/PPO/GRPO)、持续蒸馏等工作,构建可复用的训练pipeline与评测体系,实现模型效果与成本的最优平衡。探索落地最前沿的AI技术:紧跟学术与业界动态,撰写技术洞察、内部分享或对外开源/发表论文,提升团队在大模型领域的影响力。
1.多模态数据管线建设:设计并实现面向大模型训练与推理的多模态数据处理与构建管线,覆盖图像、视频、音频、文本、3D 及多模态理解等数据类型,支撑预训练、后训练(SFT / RLHF / Preference)及评测数据构建; 2.大规模数据工程与系统建设:构建高可靠、可扩展的数据处理系统,支持 TB / PB 级数据规模,负责批处理与流式处理任务的工程实现,参与或主导分布式并行计算(CPU / GPU 混合)的工程落地; 3.数据质量与稳定性保障:建立数据校验与质量评估机制,覆盖数据完整性、一致性、分布异常与质量回归等场景,设计并推动数据处理链路的监控与异常治理; 4.数据资产化与标准化建设:推动多模态数据结构的标准化设计,建设数据元信息、版本管理与可追溯机制,提升数据的可复用性与长期资产价值; 5.跨团队协作与需求落地:与算法、模型、平台等团队深度协作,将模型需求与业务目标转化为可落地的数据工程方案,参与复杂数据问题的拆解、方案设计与推进落地。