蚂蚁金服研究型实习生-多Agent协同攻防研究
任职要求
研究领域: -目前正在攻读计算机科学或相关STEM领域的硕士或博士学位 -具有一种或多种通用编程语言的经验,包括但不限于: Java,C/C ++ 、Python、JavaScript或Go -具有上述研究领域的相关经验,包括行业经验或作为参与实验室研究 优先录用: -对技术研究充满热情,具有产生新思想和创新的能力; 在自学,问题分析和解决方面表现出色 -在国际会议上或核心期刊发表一份或多份出版物或论文 -至少3个月的全职工作
工作职责
研究领域: 机器学习 项目简介: 当前网络攻击呈现高度组织化、智能化的特征,传统单点防御体系因缺乏动态协同能力,难以应对跨域渗透、APT攻击等复杂威胁。多Agent技术通过分布式智能体的自主感知与协同决策,可有效模拟攻击链行为、实现威胁闭环处置,但现有系统仍面临关键挑战:攻击场景动态演化导致任务分配失准,异构Agent间信任机制缺失引发协同效率下降,多源告警与流量日志等跨模态数据融合困难制约研判精度。本项目聚焦多Agent协同攻防的核心瓶颈,构建融合博弈论与联邦学习的动态任务调度模型,设计基于知识图谱的跨模态语义对齐机制,研发支持实时风险评估的协同决策引擎,为构建自适应、高鲁棒的新一代智能安全防御体系提供理论支撑与技术路径。
面向云数据库运维体系,充分利用各类数据、知识、工具,对工单处理、异常发现、根因定位、优化治理、故障恢复等日常运维任务,进行大幅度提效,实现半自动甚至全自动的智能运维体系升级。具体研究内容包括但不限于: 1.探索复杂故障的智能化定位与恢复相关技术; 2.探索领域知识库的自动化沉淀相关技术; 3.探索分布式环境下的多Agent协同相关技术。
专注于文档理解、推理、生成大模型的研究、探索和开发,具体职责包括: 1、通过研究长文本压缩算法、multi-agent协同、long cot、数据自动合成技术等提升超长文本、多文档能力; 2、通过研究PPO、DPO、RFT、GRPO等强化学习技术,提升文档大模型的推理能力、复杂指令遵循和泛化性; 3、研究文档创作技术,提升大模型的写作、纠错、改写、仿写、风格化、长文本输出、字数遵循等创作能力; 4、研究多模态文档解析和理解技术,提升多模态文档细粒度理解、多模态多页长文档、多模态复杂推理等技术; 5、研究面向法律行业文档理解和推理关键技术。
研究领域: 人工智能 项目简介: 通用 AI Agent以强大的自主任务执行能力和潜在的广泛应用场景引发了科技界的广泛关注。安全场景任务类型多、研判分析要求高,需要更强更有自主规划决策能力的Agent;项目将重点研究Multi-Agents、Plan、Memory等方向,包括但不限于: 1. 多代理协同架构:采用“规划-执行-验证”的多代理协同架构,包括规划代理、执行代理和验证代理,确保任务的高效完成; 2. 自主规划:理解任务总目标,自主分解任务、制定行动计划,并在适当时机复核并更新计划; 3. 深度记忆功能:高效记录历史操作路径,基于长链路的记忆,优化后续执行计划和决策。
职位描述: 1、参与Agent系统的原型构建与落地,探索提升Agent自主理解、规划与执行任务能力的新思路与方法; 2、优化Agent的对话交互机制,尝试新颖的交互方式,以提升用户体验和任务完成的流畅性与智能性; 3、研究并实验Agent的知识整合与上下文记忆管理方案,探索更高效、智能的信息组织与检索技术,支持Agent进行更深层次的思考; 4、探索Agent与系统工具、API的智能协同策略,参与设计和验证更鲁棒、灵活的工具调用与任务规划流程,鼓励提出创新交互方案; 5、针对特定复杂场景,调研并实践Agent解决用户实际问题的创新路径,挑战并拓展Agent的能力边界。