小红书社区模型标注-模型数据技术运营
任职要求
1.技术背景: 计算机/AI相关专业,具有机器学习项目经验者优先,熟悉大模型应用(如LLM微调、数据增强),有数据生成/合成/标注实战经验更佳 2.问题解决能力: 精通数据与模型协同优化,能通过Prompt工程、…
工作职责
1.大模型与数据技术融合: 基于业务场景,通过大模型微调训练(Fine-tuning)、提示词工程(PE)及RAG技术等,驱动数据生成/合成/预标方案的创新落地;搭建从数据圈选、处理到交付的全链路自动化能力,支撑智能标注与业务闭环,提升数据服务效率 2.数据工程效能升级: 开发自动化生成/合成/预标工具链,结合大模型能力优化标注流程,提升数据标注效率与模型训练ROI,降低人工投入成本 3.技术方案与项目管理: 主导数据生成/合成/预标方案的技术实现路径探索及验证(如人机协同标注、Auto PE),推动跨团队协作与规模化落地
1. 负责大模型后训练阶段的数据策略,包括SFT、RLHF、DPO等对齐方法所需的数据,方向包含文本/多模态数据构建,设计全流程数据方案与策略,制定质量标准,搭建高效高质数据生产pipeline,有效提升技术预研和模型效果提升; 2. 深度理解大模型技术与产品,制定针对性数据策略,为模型效果突破提供专业建议,推动技术迭代升级; 3. 统筹协调上下游项目资源,对接算法团队需求,把控数据质量与项目进度,推动跨团队协作,确保目标高效达成。
1、设计AI标注及项目管理平台,包括传统数据标注及大模型数据标注,为用户提供数据标注作业服务及项目管理服务,包括数据采集、清洗、标注等环节,服务项目提需到结算的全流程; 2、独立完成平台产品需求分析和规划,设计产品原型,并撰写需求文档,包括定义、设计、推进等工作,对业务需求持续收集及梳理,从具体需求中抽象出平台级通用化功能组件能力; 3、持续提升AI智能化标注能力并平台化,替代重复工作,紧跟行业及业务探索辅助提升质量及效率,打造高效的人机协同的平台模式; 4、与研发、运营等部门密切合作,推进产品的快速升级,保证产品按时、高质量上线。
1.场景策略设计与落地: 深入业务场景(如相关性/满意度/内容理解/query理解等),挖掘高价值提效需求,结合大模型能力(Prompt工程、边标边训等)设计AI解决方案,针对性解决标注质量、效率等核心痛点,推动业务效率提升; 2.全链路项目管理: 输出从模型需求分析、数据圈选及清洗、Prompt优化到模型评估的全流程效率提升空间和方案,构建核心指标监控体系(如模型ROI、数据标出率、有效率等),确保投入与业务收益的平衡; 3.AI运营资产沉淀: 搭建可复用的Prompt指令库、场景化解决方案库,推动AI工具在业务线规模化复用,提升AI资产复用率,降低AI预标工具开发成本。