小红书模型标注-模型数据策略运营
任职要求
1、本科以上学历,具备1年以上互联网内容产品相关的AI模型训练经历,熟知模型训练的常用方法、训练过程中的模型效果调优和问题解决办法,成功交付过业务模型; 2、熟知标注业务全链路,至少具备1个垂类(搜索/商业化/交易/安全/内容理解等)的业务执行及策略经验,具备整体数据解决方案的能力; 3、具备大模型应用的实战经验,有过以大模型应用解决数据解决策略问题的落地showcase; 4、目标驱动型,对待复杂问题有清晰的拆解思路,能主动发现问题、灵活应对及独立解决问题的能力,抗压能力强; 5、具备强烈服务意识、领导力、创新能力、开阔视野、能保持高度工作热情,出色的业务沟通、内外部协作及项目管控能力;具备SQL、项目管理(PMP、高级项目经理证书)、数据分析能力者优先。
工作职责
1、对业务模型训练效果的数据负责,与算法进行专业对话,结合模型能力要求进行数据策略的制定,为模型效果提供最优解决方案,支持从模型冷启、样本设计、数据生产、效果优化、线上监控的全过程,推动策略迭代提升模型效果; 2、负责搜索、安全生态、内容理解、大模型、商业交易等业务板块的模型需求,基于业务场景模型的应用效果设计运营链路,从模型实际应用收益出发,推动模型的策略、规则、数据链路的优化; 3、基于行业常见智能化应用手段,例如agent、rag、pe等,进行智能化标注策略设计,提供专业的智能化数据方案,搭建人机协同、智能化标注等数据链路,拿到效率、成本的收益; 4、保持数据行业前沿的视角和前瞻性的专业思考,持续推进智能化标注策略迭代,同时辅助内部工具平台、组织与业务交付流程的优化,提出有效建议,提高团队整体业务效率。
1. 负责大模型后训练阶段的数据策略,包括SFT、RLHF、DPO等对齐方法所需的数据,方向包含文本/多模态数据构建,设计全流程数据方案与策略,制定质量标准,搭建高效高质数据生产pipeline,有效提升技术预研和模型效果提升; 2. 深度理解大模型技术与产品,制定针对性数据策略,为模型效果突破提供专业建议,推动技术迭代升级; 3. 统筹协调上下游项目资源,对接算法团队需求,把控数据质量与项目进度,推动跨团队协作,确保目标高效达成。
1、 独立刻画出符合当前业务场景需求的安全数据体系,包括不限于常规的审核风险体系、生态风险体系等。 2、协同算法设计模型数据策略方案,涵盖专项、非专项安全场景下安全数据训练策略。 3、从模型的数据样本建设、评测体系设计、安全标注自动化升级等,能从模型底座能力上解决策略、模型在用户问题上带来的误伤,漏放。 4、有比较强的agent协同理解,同时具备一定PE技巧,推动安全在各类问题上以自动化形式解决,搭建安全PE-workflow,提升各团队工作效能。 5、能够和算法讨论出适配于不同场景下模型的安全能力(基于数据本身),需要协助算法做好问题分析、数据筛选、策略过滤、模型效果验证。
1、对业务模型训练效果的数据负责,与算法进行专业对话,结合模型能力要求进行数据策略的制定,为模型效果提供最优解决方案,支持从模型冷启、样本设计、数据生产、效果优化、线上监控的全过程,推动策略迭代提升模型效果; 2、负责搜索、安全生态、内容理解、大模型、商业交易等业务板块的模型需求,基于业务场景模型的应用效果设计运营链路,从模型实际应用收益出发,推动模型的策略、规则、数据链路的优化; 3、基于行业常见智能化应用手段,例如agent、rag、pe等,进行智能化标注策略设计,提供专业的智能化数据方案,搭建人机协同、智能化标注等数据链路,拿到效率、成本的收益; 4、保持数据行业前沿的视角和前瞻性的专业思考,持续推进智能化标注策略迭代,同时辅助内部工具平台、组织与业务交付流程的优化,提出有效建议,提高团队整体业务效率。
1.智能化应用方案设计与落地:深入模型标注作业与非作业场景,结合大模型与Multi-Agent技术,通过Prompt工程、微调与RAG等方法,打造AI预报、AI辅标、智能匹配与AI助手等低代码解决方案,推动在各类标注业务中的开发与迭代落地; 2.技术融合与产品化实现:聚焦数据服务效率与质量,利用大小模型结合的高阶技术方案探索与实施,提供贯穿需求-项目-调度-作业-结算全流程的可落地AI能力,推动数据自动生成、合成与预标注流程创新,实现技术产品化与通用AI能力在团队内落地; 3.效能提升与工具创新:搭建可复用的Prompt指令库、Agent工作流与场景化解决方案,推动AI工具与Multi-Agent能力在业务中的低成本规模化应用,推动前沿算法与标注业务场景深度融合。