夸克千问C端事业群-语音大模型数据策略运营-杭州
任职要求
1、本科以上学位,语言学、语音学、计算语言学、语用学、心理学、汉语言等相关专业优先;
2、2-3年以上语音数据相关工作经验,熟悉音视频创作、智能语音交互场景,有大语言模型相关的科研项目或工作经历…工作职责
1、负责语音大模型的数据构建,搭建高效高质的数据生产Pipeline和数据标准,用高质量数据提升算法和业务落地的效果; 2、负责语音大模型语音录制、数据寻源、音色数据筛选,搭建科学敏捷的筛选评测Pipeline,包括但不限于排期安排、资源调配以及跨部门沟通协作,确保每个项目都能高效、高质量地完成。 灵活应对录音人选状态变化,适时调整录制计划以保证声音效果。 3、深度理解模型,有敏锐的声音判断能力,设计与业务目标贴合的数据与评测方案;与产品算法团队协同,积极探索自动化数据生产/模型评估、数据合成等方法,提高数据探寻、标注效率; 4、做好数据和评测项目的人力、成本、进度等管理,协调项目资源,推动跨部门沟通合作,达成项目目标。 5、数据音色寻源判断,可自带资源
1、负责语音大模型数据构建,设计各技术方案下各阶段数据方案与策略,建设专业、敏捷的流程&标准,管理高效高质的数据生产Pipeline,有效提升技术预研/业务落地效果; 2、负责端到端语音大模型评测体系建设,设计模型优化敏感、业务场景适配的评测方案与流程,建设并管理科学、敏捷的评测Pipeline,为模型效果提升提供有价值的优化方向与反馈; 3、推动跨团队合作,理解上游需求并统筹下游人力,负责项目资源的协调与组织,与算法/产品进行良好沟通,确保项目团队协同工作,推动语音方案在业务场景的落地。
1、负责大模型TTS和大模型音频生成技术构建。为语音助手超级智能体提供音频技术支持,包括但不限于TTS、端到端语音大模型、音频AIGC等; 2、负责关键场景的语音交互大模型算法优化,构建高质量低延迟的TTS和音频生成系统,提升业务效果; 3、跟进业界前沿的语音生成大模型技术,如语音端到端大模型和全模态模型等,提升语音助手场景的智能化并落地产品。
1、参与设计并实现高性能、可扩展、分布式大数据处理平台,通过数据驱动模型训练,支撑夸克智能语音相关业务算法生产与高效迭代; 2、与算法工程师密切配合,理解深度学习模型研发流程,负责/参与前沿模型研究中数据解决方案的设计、开发和维护; 3、通过AI能力来赋能数据建设,持续提升平台数据生产效率、易用性、降低算法使用成本
1、建立并优化大模型评测体系和方法,设计科学的评估框架与指标体系,定义大模型效果的理想态和制定及优化评测标准,产出稳定可信的专业评测分析结论,提出可落地的模型能力提升与产品体验优化策略,并推动跨团队闭环落地; 2、高效承接大模型文本/图片/视频/语音方向的大模型评测业务需求,统筹多个评测项目的管理工作,独立承担评测策略及标准制定及优化、项目管理、流程优化、质量把控、报告撰写等工作;能够基于业务数据,进行模型效果评估、分析、问题定位及反馈; 3、持续跟进业界评测研究与方法论,结合实际业务场景迭代内部评测方案,探索更贴近真实用户体验的评测方法,与产品算法团队紧密合作,制定有效的数据策略,推动产品目标达成和大模型效果提升; 4、持续跟踪业务产品与技术动态,建立对标分析机制,输出趋势判断与策略建议,辅助产品方向制定决策。