快手多模态大模型数据运营专家-【可灵AI专项】
任职要求
1、具备计算机科学、人工智能、数字媒体、设计学或相关专业背景者优先,拥有2年以上项目管理经验,并有图像、视频、图文结合等多模态数据生产或标注项目经验;
2、深刻理解多模态大模型对图文数据的核心要求,熟悉视频生成、图片生成、多模态理解等任务的数据范式与质量标准,具备优秀的视觉理解能力和图文逻辑判断力,…工作职责
1、数据策略制定与规划,与算法团队深度协同,负责多模态数据生产的规划与项目交付; 2、数据产线搭建、运行、交付与质量保障,设计数据产线,确保项目按计划、高质量交付,对最终交付结果负责;有系统性的数据运营方法论,通过建立深度的质量监控与反馈机制,确保生产效率与数据准确性; 3、持续优化数据生产的流程,沉淀最佳实践,不断优化效率与质量; 4、层次级的数据专家资源生态的搭建与管理,基于项目需求制定合理的任务定价、结算规则和资源数量规划; 5、成本投入策略设定与风险控制,实现项目成本的精细化运营,有效进行项目规划、风险预警与管理。
1、主要负责可灵平台推荐/搜索/内容理解等方向算法优化,帮助提升可灵平台用户留存、营收等核心指标; 2、参与大规模机器学习、深度学习领域技术研发工作,包括但不限于多模态、大模型SFT等算法研发; 3、参与搭建可灵平台在线学习策略算法系统,快速处理海量用户数据,提升算法性能,满足高并发、高时效性和可靠稳定性; 4、和产品、运营等团队合作,共同优化可灵社区生态,提供给用户更好体验,满足用户视频内容生产与消费、社交互动等多维需求。
构建和完善服体大模型语料库,例如通过撰写对话语料来完成对话及NLP任务,重点是产出与客户服务相关的高质量对话数据; 负责迭代和调优数据语料,提升对话数据的质量情况、流畅度和和互动性; 深入分析和研究客户服务与用户体验场景,确保对话内容的精准度和创造性; 跨部门团队协作,根据项目需求,完善对应标准和流程,完成特定数据的生产任务; 输出与带教,协助团队其他非技术向员工,提升该群体对大语言模型的了解程度、教授实际应用技巧等,以辅助团队更好完成业务目标 带领团队高效完成标注和内容生产项目同时负责管理标注团队,积极推动标注工具、组织流程及交付流程优化,提升并完善团队的交付能力
1、主要负责可灵平台推荐/搜索等方向算法优化,帮助提升可灵平台用户留存、营收等核心指标; 2、参与大规模机器学习、深度学习领域技术研发工作,包括但不限于推荐算法、多模态、大模型SFT等算法研发; 3、参与搭建可灵平台实时在线学习推荐算法系统,快速处理海量用户数据,提升算法性能,满足高并发、高时效性和可靠稳定性; 4、和产品、运营等团队合作,共同优化可灵社区生态,提供给用户更好体验,满足用户视频内容生产与消费、社交互动等多方面需求。
1、产品战略与规划:定义数据标注平台的核心能力,制定支持可灵AI数据标注、采集、清洗、评估、标注业务经营管理的产品路线图,深入理解多模态大模型的数据标注需求,设计针对性数据生产管线与工具; 2、标注系统智能化:围绕模型辅助标注,提升标注效率与一致性,探索模型标注与人工标注的协同机制,降低数据成本; 3、专家协作生态构建:设计专家标注员管理、培训与质量评估体系,确保高质量要求数据(如专业的影视参数)的高质量产出,搭建众包+专家协同的混合生产模式,平衡效率与质量; 4、AI驱动数据闭环:推动标注数据反哺模型优化,构建“数据-模型-标注”自动化迭代闭环,建立行业领先的数据质量认知体系; 5、跨团队协同:联动AI算法、数据、标注运营团队,确保平台能力与业务需求深度对齐。