logo of tongyi

通义研究型实习生-智能体规划能力增强与研究

实习兼职通义研究型实习生地点:北京 | 杭州 | 上海状态:招聘

任职要求


1、NLP/ML/RL背景,在读研究生以上学历,有大模型优化经验,第一作者发表过顶级会议论文;
2、扎实的算法能力,优良的编程风格,熟悉Python/C++语言,具备复杂系统的设计开发调试能力;
3、优良的沟通表达能力、团队合作意识和经验;具备快速学习的能力,以及深入钻研技术问题的耐心。

工作职责


随着大模型能力的增强,Agent在各个领域取得了显著进步,智能体正逐步实现复杂任务的自动化。然而,在面对多步骤决策和长Inference链路任务时,智能体常常显得力不从心,难以优化全局规划与执行效率。提升智能体的规划能力成为智能体研究中的重要方向。
智能体规划能力增强技术旨在通过优化Planning的路径选择、决策树构建和计划执行,来提升智能体在复杂环境中完成任务的能力。该技术结合强化学习(Reinforcement Learning)和启发式搜索(Heuristic Search)等方法,力求实现智能体的自主决策与学习,从而在动态和不确定环境中表现出更加智能和高效的行为。
在智能体规划能力增强与研究领域,目前面临的主要挑战包括:复杂环境中的多步骤任务规划、多模态信息的综合处理、实时动态调整和优化策略等。为解决这些问题,本Project将深入探索智能体的规划算法与能力增强技术,提出具有更高效率和鲁棒性的解决方案。
包括英文材料
NLP+
学历+
大模型+
算法+
Python+
C+++
相关职位

logo of tongyi
实习通义研究型实习生

随着大模型能力的增强,Agent在各个领域取得了显著进步,智能体正逐步实现复杂任务的自动化。然而,在面对多步骤决策和长Inference链路任务时,智能体常常显得力不从心,难以优化全局规划与执行效率。提升智能体的规划能力成为智能体研究中的重要方向。 智能体规划能力增强技术旨在通过优化Planning的路径选择、决策树构建和计划执行,来提升智能体在复杂环境中完成任务的能力。该技术结合强化学习(Reinforcement Learning)和启发式搜索(Heuristic Search)等方法,力求实现智能体的自主决策与学习,从而在动态和不确定环境中表现出更加智能和高效的行为。 在智能体规划能力增强与研究领域,目前面临的主要挑战包括:复杂环境中的多步骤任务规划、多模态信息的综合处理、实时动态调整和优化策略等。为解决这些问题,本Project将深入探索智能体的规划算法与能力增强技术,提出具有更高效率和鲁棒性的解决方案。

更新于 2025-04-17
logo of tongyi
实习通义研究型实习生

随着大模型技术的不断发展,代码智能体在实际软件开发流程中展现出巨大的潜力,能够显著提升开发效率。本项目致力于探索大规模代码模型作为智能体的潜能,目标是在仓库级别的代码生成、自动issue修复等场景中,增强代码模型的智能性与自动化处理能力。我们专注于提升大规模代码模型在以下方面的能力: 1. 代码智能体的规划能力; 2. 代码智能体的检索与工具调用能力; 3. 代码智能体的自动修复能力。

更新于 2024-10-14
logo of antgroup
实习研究型实习生

研究领域: 深度学习 项目简介: 随着基础大模型能力的提升,对模型短板数据/知识型数据的需求越来越大;通过正向挖掘很难补充该分布数据; 以下两个关键点需要投入人力研究: 1、通过智能体工作流来融合多模态大模型的协同与规划能力;提升整体数据链路的任务覆盖广度与深度; 2、通过数据主动合成探索数据闭环实现路径;提升交付自动化程度与质量;

logo of antgroup
实习研究型实习生

研究领域: 人工智能 项目简介: AI智能体以强大的自主规划执行能力和广阔的应用前景引发了科技界的密切关注和巨大投入。本项目重点关注智能体的能力突破,在以下领域深耕创新、探索前沿,打造Agent Native Model和AI Native的智能体产品。 1. UI Agent:AI自主完成复杂的Phone/Computer/Browser Use任务 2. 深度研究:AI自主完成通用的深度研究型的任务,动态规划、灵活调用多种工具或智能体 3. 安全深度分析:深入理解安全风控领域的任务要求,掌握领域工具,提供专业深度的分析、提前发现风险/治理漏洞