logo of antgroup

蚂蚁金服研究型实习生-智能体工作流与数据合成算法研究

实习兼职研究型实习生地点:杭州状态:招聘

任职要求


研究领域:
-目前正在攻读计算机科学或相关STEM领域的学士,硕士或博士学位
-具有一种或多种通用编程语言的经验,包括但不限于: Java,C/C ++ 、PythonJavaScriptGo
-具有上述研究领域的相关经验,包括行业经验或作为参与实验室研究
优先录用:
-对技术研究充满热情,具有产生新思想和创新的能力; 在自学,问题分析和解决方面表现出色
-在国际会议上或核心期刊发表一份或多份出版物或论文
-至少3个月的全职工作

工作职责


研究领域:
  深度学习
项目简介:
  随着基础大模型能力的提升,对模型短板数据/知识型数据的需求越来越大;通过正向挖掘很难补充该分布数据;
以下两个关键点需要投入人力研究:
1、通过智能体工作流来融合多模态大模型的协同与规划能力;提升整体数据链路的任务覆盖广度与深度;
2、通过数据主动合成探索数据闭环实现路径;提升交付自动化程度与质量;
包括英文材料
学历+
Java+
C+
Python+
JavaScript+
相关职位

logo of aliyun
实习阿里云研究型实习

我们正在寻找对大模型系统优化充满热情的优秀在读学生,参与大模型后训练阶段(Post-Training)关键系统与架构的前沿研究。你将深度参与千亿级大模型在强化学习训练、推理效率、训推分离架构、智能体(Agent)系统等方面的系统级优化工作,探索高MFU、低延迟、高吞吐的下一代AI基础设施。 如果你热爱系统与AI的交叉领域,希望在真实超大规模场景中打磨技术,欢迎加入我们,与顶尖研究者和工程师共同推动大模型系统的技术边界! 研究方向与实习内容: 你将从以下四个核心方向中选择1-2个深入参与,开展系统性研究与工程实现: 1. 后训练 MFU(Model FLOPs Utilization)优化 研究SFT、RLHF、DPO等后训练任务中的计算效率瓶颈; 设计高MFU的训练策略与系统支持,优化计算密度(如序列填充、混合批次、梯度累积等); 探索算力利用率提升路径,结合通信、显存、计算进行端到端建模与优化。 2. 强化学习推理框架优化 针对RLHF中大量采样推理的需求,优化推理延迟与吞吐(如Speculative Decoding、KV Cache复用、动态批处理); 设计轻量、高效的推理引擎,支持多轮对话、长上下文、流式生成等复杂场景; 探索训练-采样协同优化,降低推理端对训练整体效率的制约。 3. 强化学习训推分离架构优化 构建解耦的“训练-采样”系统架构,支持高并发采样与异步训练更新; 研究采样集群与训练集群之间的资源调度、数据同步与负载均衡机制; 实现弹性扩缩容、故障恢复、版本管理等系统能力,提升整体稳定性与可扩展性。 4. Agent 框架优化与系统支撑 研究面向复杂任务的Agent执行框架,优化工具调用、状态管理、多步规划的系统性能; 构建低延迟、高并发的Agent运行时环境,支持大规模仿真与自动评估; 探索Agent工作流的可复现性、可观测性与调试支持,提升研发效率。

更新于 2025-09-05
logo of antgroup
实习研究型实习生

研究领域: 网络与信息安全 项目简介: 随着智能体服务的兴起,智能体互连网络存在潜在安全风险是现有互联网安全体系难以解决的问题,主要在于 1. 用户感知和控制力减弱:主动服务被滥用风险, 服务推荐与决策偏差、隐私泄露与数据滥用风险 2. 数据共享和互操作性增加:跨智能体的信任和身份验证风险、Agent间通信安全、数据泄漏与隐私扩散风险倍增、跨域权限管理和越权访问风险 3. 互连拓扑复杂性增加、攻击面扩大:用户意图理解与Agent协作秩序,Agent攻击扩散风险加剧、服务依赖带来的连锁风险、信任边界模糊和信任链条脆弱 针对这些新风险,本项目希望对智能体可信互连网络展开研究,解决连接可信、交互可信、意图可信、数据可信的问题。

logo of antgroup
实习研究型实习生

研究领域: 人工智能 项目简介: 通用 AI Agent以强大的自主任务执行能力和潜在的广泛应用场景引发了科技界的广泛关注。安全场景任务类型多、研判分析要求高,需要更强更有自主规划决策能力的Agent;项目将重点研究Multi-Agents、Plan、Memory等方向,包括但不限于: 1. 多代理协同架构:采用“规划-执行-验证”的多代理协同架构,包括规划代理、执行代理和验证代理,确保任务的高效完成; 2. 自主规划:理解任务总目标,自主分解任务、制定行动计划,并在适当时机复核并更新计划; 3. 深度记忆功能:高效记录历史操作路径,基于长链路的记忆,优化后续执行计划和决策。

logo of antgroup
实习研究型实习生

研究领域: IoT 项目简介: 具身智能作为人工智能发展的新范式,通过物理实体(如机器人、无人系统等)直接与现实世界交互,其核心挑战在于融合AI与物理实体的安全可控性。当前系统涉及硬件设施、算法模型、数据系统等多维度复杂性,潜在攻击面包括传感器漏洞、多模块协同干扰、算法对抗攻击等。恶意攻击很可能引发具身智能体执行危险动作。传统安全防护难以应对物理域与信息域的双重威胁,目前不少厂家都在使用的开源项目Robot Operation System(机器人操作系统,简称ROS)最初以科研为目标场景,缺乏系统整体性安全设计。随着ROS的广泛应用,很多安全问题随之暴露,本项目希望对具身智能操作系统的安全性展开研究,提供系统性解决安全问题的方案。