夸克智能信息-多模态大模型安全算法专家-大模型安全
任职要求
1. 三年以上算法研发经历,计算机相关专业研究生及以上学历; 2. 具有大模型应用、多模态应用、内容安全、大模型安全领域相关工作经验优先; 3. 熟悉大模型算法、多模态算法、AI Agent其中一个或多个领域; 4. 责任心强,积极主动,有良好的沟通能力和团队合作能力; 5. 在机器学习/CV/NLP/人工智能相关领域会议或期刊(如ICML、CVPR、ICCV、ECCV、AAAI、ACL等)发表过论文或者有竞赛经验者优先。
工作职责
1. 负责多模态内容安全防控体系搭建,建设多全模态内容审核能力、多模态大模型安全调优能力,保证业务安全及大模型应用安全; 2. 多模态大模型算法:参与多模态大模型安全能力建设,负责多模态大模型安全能力、跨模态通用表征、AI Agent、AIGC等算法研发与应用,建立端到端多模态安全风控解决方案,紧跟业界前沿研究方向; 3、岗位特色:应对全风险,全模态问题,快速提升综合算法能力,与大模型时代发展同步,深耕大模型安全领域,持续积累安全领域业务经验; 4、业务支持:保障夸克AI、通义千问ToC、UC浏览器、书旗小说、超级汇川等产品的内容安全及大模型安全; 5、部门特色:作为综合型安全中台,包含法务、GA、公关、数安、内安、商安等职能,协同共建为业务提供全面安全保障。
1. 负责NLP内容安全防控体系搭建,负责语言大模型防控能力及链路建设,包括NLP内容审核能力、安全代答能力,跨模态特征检索能力、大模型安全微调能力等,保证业务安全及大模型应用安全; 2. NLP大模型算法:参与语言大模型风控的数据、算法、决策完整体系建设,负责NLP文本分类、RAG、AI Agent、跨模态检索、NLP安全大模型等算法研发,在业务场景打造行业一流的语言大模型安全风控体系; 3、岗位特色:应对全风险问题,快速提升综合算法能力,与大模型时代发展同步,深耕大模型安全领域,持续积累安全领域业务经验; 4、业务支持:保障夸克AI、通义千问ToC、UC浏览器、书旗小说、超级汇川等产品的内容安全及大模型安全; 5、部门特色:作为综合型安全中台,包含法务、GA、公关、数安、内安、商安等职能,协同共建为业务提供全面安全保障。
1. 大模型攻击研究 ● 针对大语言模型(LLM)、多模态模型(VLM)、智能体(Agent)等开展安全性与幻觉问题研究,系统化识别模型在对抗样本、越狱攻击、数据投毒、隐私泄露、注入、越权等方面的脆弱点; ● 设计并优化大模型对抗攻击算法,研究 Prompt 注入、自动化越狱策略与生成式数据增强方法,用于模拟实战攻击与安全性评估; ● 构建覆盖文本、图像、语音等多模态、agent场景的攻击方法库,支撑红队测试与模型安全基准建设。 2. 大模型防御机制 ● 研究大模型输入/输出层面的安全检测与防御机制,开发 Prompt 过滤、上下文改写、敏感内容抑制等方法; ● 构建跨模态、多层次的安全防护框架,提升 LLM/VLM/Agent 在实际应用中的鲁棒性。 3. 大模型安全对齐 ● 探索使用SFT、RL、MoE、RAG、Editing等对齐方法,提升模型的内生安全能力; ● 研究有害内容规避、幻觉抑制、安全对齐评测等关键技术,推动安全性融入模型全生命周期。 4. Agent 安全 ● 研究 Agent 在memory存储、多工具调用、链式推理中的攻击面与潜在风险,识别敏感数据泄露、工具滥用、意图篡改、海绵攻击等新型威胁; ● 设计 Agent 安全管控机制,包括权限控制、任务隔离、调用审计等,确保复杂场景下 Agent 的安全可控。
1. 多模态大模型训练与优化。围绕文本、图像等多模态数据,构建面向安全领域的垂直大模型,推动在内容理解、风险识别等场景的落地应用。 2. 模型架构设计与迭代。基于现有大模型底座,进行模型结构优化、训练策略设计及效果调优,提升模型在实际业务中的泛化能力与推理效率。 3. 数据处理与标注体系建设。构建高质量的多模态训练数据集,设计合理的标注流程与标准,支撑模型训练与评估。 4. 联合业务方推进模型部署与应用。与产品、工程团队紧密协作,完成模型从训练到上线的全流程闭环,并持续跟踪效果与优化。
关于我们: AI Business 成立于2023年4月,是阿里国际数字商业集团设立的一层业务组织,专注于大模型技术能力建设和 AI 原生应用和产品的打造,旨在用最先进的 AI 技术重塑平台竞争力,为商家和用户带来极致电商体验。 作为跨境电商领域的 AI 先锋,我们坚定地相信人工智能对塑造未来电商的关键作用,并坚持对 AI 领域人才的培养和发展。我们已经汇聚了业内顶尖的 AI 算法专家、AI 工程师和AI产品团队,并诚挚邀请有共同使命感、追求创新与卓越的 AI 人才加入我们的团队,共同用AI技术书写数字商业领域的新篇章。 职位描述: 1、负责多语言大语言模型(LLM)的预训练、微调及优化,探索高效训练策略(如低资源语种能力迁移、任务调度优化等),提升模型性能与跨文化场景适应性; 2、构建多模态大模型技术体系,包括图文生成、视频内容生成、多模态检索与信息抽取,支持商品虚拟试穿、智能客服等业务场景。 3、推动大模型与业务深度融合,开发基于LLM的对话系统、Agent产品及RAG系统,优化电商文本生成、跨语言信息匹配、时间序列预测等场景的智能决策能力; 4、设计强化学习对齐算法(如RLHF/DPO),提升模型在垂直领域(如商品推荐、用户交互)的精准度与可控性。 4、实现大模型的高效推理部署,包括模型压缩量化、GPU并行计算优化(如CUDA加速),确保高并发场景下的服务稳定性; 5、探索生成式AI与电商场景结合的前沿技术(如AIGC内容生成、多模态商品检索),推动技术规模化落地。