logo of antgroup

蚂蚁金服研究型实习生-黑灰产群聊会话的Topic挖掘

实习兼职研究型实习生地点:上海状态:招聘

任职要求


在大语言模型或者NLP方向有A类论文一作发表,2027年及以后毕业的硕博研究生,能够实习三个月以上。

工作职责


研究领域:
  自然语言处理
项目简介:
  千万级的黑产群聊消息属于文图音视链多模态数据,短句子交错、发言人数量多,导致话题分割困难,传统的借助序列标注或边界监测等方案的主题模型难以进行准确分割,群聊相比于只存在两个发言人的QA抽取任务也更困难。传统的单条内容理解方案只能抽取已知的关键特征,无法应对黑灰产变化快的特点,需要智能化方法主动识别新风险,借助LLM的长思维推理能力对新风险进行分析解读;
包括英文材料
NLP+
相关职位

logo of antgroup
实习研究型实习生

研究领域: 人工智能 项目简介: 黑产不变性通过规模化计算每天的用户各种行为模式的加速度来发现可能的批量案件,一方面通过快速发现来减少损失,另一方面自动挖掘黑产的具体手法提高后续的防控速度。但是模式的内容和颗粒度选择会显著影响相关结果的准确率和覆盖率。本课题的目标是:如何通过算法+工程的融合设计,自动找到里面最优的平衡点。

logo of antgroup
实习研究型实习生

研究领域: 人工智能 项目简介: 随着黑产技术的不断演进和变化,传统的资金风控模型每隔一段时间都会面临着显著的性能衰退问题。具体而言:首先,黑产不断尝试新的攻击手段;其次,基于固定时间窗口的数据训练模型容易受到数据分布漂移的影响,导致模型效果随时间推移而下降。同时,使用最新数据进行模型迭代训练时,新模型会忘记老的知识,使得在某些情况下新模型的表现可能不如旧模型,需要在迭代过程中保留对历史风险模式的记忆。因此,如何构建一个能够持续学习,适应风险攻防形势,同时保持对历史风险记忆的风控模型,成为了当前亟待解决的问题。 同时,近期基础大模型能力的不断提升,也给资金风控智能化带来新的机会。除了传统的基于结构化数据的建模可用于线上实时风险识别之外,大语言模型也可以消费更多非结构化数据信息并进行逻辑分析与推理,可以与传统的分类模型互为补充,大幅提升现有风险防控水平。 本项目分两个方向:(1)方向一:将聚焦于持续学习、迁移学习、样本曝光偏差处理、Tabular 数据建模等关键技术方向,预期开发出一种风控模型的自适应学习方案。该方案使得风控模型可以能够在面对不断变化的风险环境时,通过迭代保持高性能和高稳定性,避免性能衰退,更准确地识别和应对新兴的欺诈、赌博、洗钱和盗用等风险行为,减少误报率,提高用户体验,从而提升整体风控识别水平和管控效率;(2)方向二:将聚焦强化学习、监督微调等大模型后训练技术,不断提升大模型在资金风控领域的分析、推理能力,预期开发出一套模型微调方案,能够将风控知识高效注入到大模型当中,最终用于资金风险案例分析与防控。

logo of antgroup
实习研究型实习生

研究领域: 图计算 项目简介: 在真实业务中,我们观察到黑产攻击行为模式具备多场景复用、随时间微调的特点。具体来说,历史上某个场景验证有效的攻击模式,会在其他场景被反复循环使用。另外,同一种攻击模式,实际观察到的操作手法随时间变化也会有轻微调整。经过具体的案例分析,我们发现黑产攻击一般呈现从少到多,由缓变急的趋势。从攻击发起途径窗口期至最终止损的总耗时较长。现有的方案可以挖掘出历史上被黑产采用过的图模式,但是不能预判已经开始攻击,但是还未达到窗口期的新模式,实现提前止损。本项目旨在研发创新的融合大图模型和图计算技术的用户行为风险感知及黑产手法挖掘技术研究。

logo of antgroup
实习研究型实习生

研究领域: 自然语言处理 项目简介: LLM针对特定领域(比如案件风险分析,黑产手法分析,系统运维问题分析)的SFT和RL,都需要高质量的训练数据。除了人工标注,通过相对高质量的大模型(比如DeepSeekR1 671B)进行蒸馏是相对经济快速的方法,但是极度依赖于相关的蒸馏prompt设计和迭代优化。