小红书生成式大模型安全策略产品
任职要求
任职要求 1.本科及以上学历,计算机科学、人工智能、信息安全或相关领域;2年以上互联网产品经验,有AI安全、内容治理或风险控制相关经验。 2.精通生成式AI技术(如LLM、扩散模型)及其安全挑战,熟悉常见攻击和防护方案,精通AIGC识别基本方法(Watermark、C2PA、检测模型等) 3.具备强产品思维和数据分析能力,…
工作职责
职位概述 作为小红书Trust-and-Safety团队核心成员,负责制定生成式大模型相关安全防护和内容治理策略,保障生成式应用的安全合规性,优化AIGC内容在平台上的检测和标识。 主要职责 1.负责生成式大模型安全防护产品策略的规划、设计和迭代,包括Safety Alignment、发prompt injection、反model jailbreak、风险生成内容过滤和实时检测机制。 2.负责设计多模态 AIGC 安全检测体系(文本/图像/视频),覆盖违规内容识别、伪造判定、真实度评估、深度伪造检测、模型生成技术追踪等方向。 3.持续跟踪和分析当前生成式AI技术的发展趋势,收集相关信息,并推动防御手段的更新和升级,以确保系统的安全性。 4.协同算法与研发团队,推动AIGC检测技术落地,优化防护效果和性能指标。 5.监控大模型安全态势,分析潜在风险,制定预防性和应急响应策略。 6.跨部门协调(如GA、安全运营、法务、数据),确保策略与业务目标对齐,并推动规模化应用。 7.跟踪行业法规和最佳实践,保障产品符合国内外安全与伦理标准。
1. 负责滴滴金融保险风险场景的模型设计、建设、开发、应用落地、持续迭代优化,为业务风险指标负责。 2. 拆解业务风险指标,转化为模型指标,并为之设定合理的提升目标 3. 尝试各类特征工程方法,挖掘集团内外部数据,加工生成有效特征,优化模型效果 4. 数据算法创新,了解并跟进业界领先的人工智能和深度学习进展,推动新的技术在风控领域落地
岗位职责: 1、负责 AI Agent 系统的设计、开发和优化、开发和完善基于大语言模型 (LLM) 的智能体系统,提升 Agent 的自主决策和任务执行能力; 2、负责生成式大模型指令意图理解相关工作,整体提升大模型的多轮对话指令理解能力和性能; 3、设计并实现 Agent 的工具使用接口,实现与各类外部系统和 API 的集成编排; 4、负责大模型在检索、推荐方面的系统设计实现和优化,探索Agent、RAG、领域模型调优等相关技术在业务场景落地; 5、具备模型知识、幻觉机制探究,提升模型知识水平、降低模型幻觉率; 6、能够基于开源模型,设计和开发算法,对模型进行微调,优化其参数和结构,以提高模型的泛化能力和准确性; 7、深入调研AI领域相关的前沿技术,跟踪业内大模型领域的最新进展,并寻求将最新技术应用到产品的可能性。
1、参与亿级用户规模的电商推荐优化,提升包括商品推荐(首页猜你喜欢)、内容推荐(直播、短视频)在内的泛货架电商的GMV、订单量、用户留存等核心指标; 2、通过深度学习领域的研发工作,包括但不限于生成式推荐、LLM4Rec、超大规模序列建模、多任务学习、长期价值建模等算法和系统提升预估效果; 3、持续关注前沿技术发展方向,参与推荐系统架构的长期技术演进与技术攻坚; 4、通过推荐算法机制优化电商流量结构和GMV结构,促进电商生态的健康发展。