蚂蚁金服研究型实习生-用户行为风险感知及黑产手法挖掘技术研究
任职要求
研究领域: -目前正在攻读计算机科学或相关STEM领域的学士,硕士或博士学位 -具有一种或多种通用编程语言的经验,包括但不限于: Java,C/C ++ 、Python、JavaScript或Go -具有上述研究领域的相关经验,包括行业经验或作为参与实验室研究 优先录用: -对技术研究充满热情,具有产生新思想和创新的能力; 在自学,问题分析和解决方面表现出色 -在国际会议上或核心期刊发表一份或多份出版物或论文 -至少3个月的全职工作
工作职责
研究领域: 图计算 项目简介: 在真实业务中,我们观察到黑产攻击行为模式具备多场景复用、随时间微调的特点。具体来说,历史上某个场景验证有效的攻击模式,会在其他场景被反复循环使用。另外,同一种攻击模式,实际观察到的操作手法随时间变化也会有轻微调整。经过具体的案例分析,我们发现黑产攻击一般呈现从少到多,由缓变急的趋势。从攻击发起途径窗口期至最终止损的总耗时较长。现有的方案可以挖掘出历史上被黑产采用过的图模式,但是不能预判已经开始攻击,但是还未达到窗口期的新模式,实现提前止损。本项目旨在研发创新的融合大图模型和图计算技术的用户行为风险感知及黑产手法挖掘技术研究。
研究领域: 隐私计算 项目简介: 1.项目背景 在人工智能技术快速发展的今天,UIAgent(用户界面智能代理)正成为下一代人机交互的核心入口。然而,如何获得或构建海量多模态数据(如行为轨迹、界面标注信息、系统动线日志等)是研究的关键。但如何在保障数据隐私合规的前提下,完成高质量的场景重建与语料建模,已成为制约技术落地的关键瓶颈。本课题聚焦这一核心矛盾,探索隐私保护与数据效用之间的最优平衡,为UIAgent提供安全、合规、可用的基础数据支撑。 2.研究目标 本项目旨在构建一套全流程隐私保护框架,解决以下核心问题: 多源异构数据脱敏:针对文本、图像、时序行为等多模态数据,设计可组合的隐私擦除策略; 场景语义保真重建:在去除个人身份信息(PII)的同时,保留用户行为模式与系统交互逻辑的语义完整性; 隐私-效用博弈建模:通过理论分析与实验验证,量化隐私预算与模型性能间的权衡关系。 3.核心亮点 生成式隐私增强技术:基于扩散模型/VAE生成合成数据,既还原真实场景分布又规避隐私泄露风险; 行为轨迹知识蒸馏:将原始轨迹中的高敏感操作(如输入内容)抽象为低维符号序列,保留系统动线拓扑结构; 极致数据压缩技术:UIAgent的核心目标是理解和预测用户的界面交互行为,而非复现像素级视觉细节,将探索最小必要数据的边缘。
研究领域: 人工智能 项目简介: 随着黑产技术的不断演进和变化,传统的资金风控模型每隔一段时间都会面临着显著的性能衰退问题。具体而言:首先,黑产不断尝试新的攻击手段;其次,基于固定时间窗口的数据训练模型容易受到数据分布漂移的影响,导致模型效果随时间推移而下降。同时,使用最新数据进行模型迭代训练时,新模型会忘记老的知识,使得在某些情况下新模型的表现可能不如旧模型,需要在迭代过程中保留对历史风险模式的记忆。因此,如何构建一个能够持续学习,适应风险攻防形势,同时保持对历史风险记忆的风控模型,成为了当前亟待解决的问题。 同时,近期基础大模型能力的不断提升,也给资金风控智能化带来新的机会。除了传统的基于结构化数据的建模可用于线上实时风险识别之外,大语言模型也可以消费更多非结构化数据信息并进行逻辑分析与推理,可以与传统的分类模型互为补充,大幅提升现有风险防控水平。 本项目分两个方向:(1)方向一:将聚焦于持续学习、迁移学习、样本曝光偏差处理、Tabular 数据建模等关键技术方向,预期开发出一种风控模型的自适应学习方案。该方案使得风控模型可以能够在面对不断变化的风险环境时,通过迭代保持高性能和高稳定性,避免性能衰退,更准确地识别和应对新兴的欺诈、赌博、洗钱和盗用等风险行为,减少误报率,提高用户体验,从而提升整体风控识别水平和管控效率;(2)方向二:将聚焦强化学习、监督微调等大模型后训练技术,不断提升大模型在资金风控领域的分析、推理能力,预期开发出一套模型微调方案,能够将风控知识高效注入到大模型当中,最终用于资金风险案例分析与防控。
研究领域: 深度学习 项目简介: 在当今数字经济飞速发展的背景下,支付宝作为全球领先的金融科技平台,其巨大的用户流量形成了丰富且多维的海量流量数据。这些流量数据表示着用户的端内端外行为动线,能够反映出用户的心智偏好或者风险意图。但是目前对于端内流量的认知和盘点严重依赖人工,需要人工发现流量中的问题,并且总结流量表现的行为模式,整个过程费时费力。大模型的横空出世提供了一种通用的流量认知方案,能够识别出用户在端内的行为模式。由于垂类模型优化下,大模型的通用性能常常遭遇极速衰退,因此需要持续学习。