通义研究型实习生-智能体规划能力增强与研究
任职要求
1、NLP/ML/RL背景,在读研究生以上学历,有大模型优化经验,第一作者发表过顶级会议论文; 2、扎实的算法能力,优良的编程风格,熟悉Python/C++语言,具备复杂系统的设计开发调试能力; 3、优良的沟通表达能力、团队合作意识和经验;具备快速学习的能力,以及深入钻研技术问题的耐心。
工作职责
随着大模型能力的增强,Agent在各个领域取得了显著进步,智能体正逐步实现复杂任务的自动化。然而,在面对多步骤决策和长Inference链路任务时,智能体常常显得力不从心,难以优化全局规划与执行效率。提升智能体的规划能力成为智能体研究中的重要方向。 智能体规划能力增强技术旨在通过优化Planning的路径选择、决策树构建和计划执行,来提升智能体在复杂环境中完成任务的能力。该技术结合强化学习(Reinforcement Learning)和启发式搜索(Heuristic Search)等方法,力求实现智能体的自主决策与学习,从而在动态和不确定环境中表现出更加智能和高效的行为。 在智能体规划能力增强与研究领域,目前面临的主要挑战包括:复杂环境中的多步骤任务规划、多模态信息的综合处理、实时动态调整和优化策略等。为解决这些问题,本Project将深入探索智能体的规划算法与能力增强技术,提出具有更高效率和鲁棒性的解决方案。
随着大模型能力的增强,Agent在各个领域取得了显著进步,智能体正逐步实现复杂任务的自动化。然而,在面对多步骤决策和长Inference链路任务时,智能体常常显得力不从心,难以优化全局规划与执行效率。提升智能体的规划能力成为智能体研究中的重要方向。 智能体规划能力增强技术旨在通过优化Planning的路径选择、决策树构建和计划执行,来提升智能体在复杂环境中完成任务的能力。该技术结合强化学习(Reinforcement Learning)和启发式搜索(Heuristic Search)等方法,力求实现智能体的自主决策与学习,从而在动态和不确定环境中表现出更加智能和高效的行为。 在智能体规划能力增强与研究领域,目前面临的主要挑战包括:复杂环境中的多步骤任务规划、多模态信息的综合处理、实时动态调整和优化策略等。为解决这些问题,本Project将深入探索智能体的规划算法与能力增强技术,提出具有更高效率和鲁棒性的解决方案。
随着大模型技术的不断发展,代码智能体在实际软件开发流程中展现出巨大的潜力,能够显著提升开发效率。本项目致力于探索大规模代码模型作为智能体的潜能,目标是在仓库级别的代码生成、自动issue修复等场景中,增强代码模型的智能性与自动化处理能力。我们专注于提升大规模代码模型在以下方面的能力: 1. 代码智能体的规划能力; 2. 代码智能体的检索与工具调用能力; 3. 代码智能体的自动修复能力。
研究领域: 深度学习 项目简介: 随着基础大模型能力的提升,对模型短板数据/知识型数据的需求越来越大;通过正向挖掘很难补充该分布数据; 以下两个关键点需要投入人力研究: 1、通过智能体工作流来融合多模态大模型的协同与规划能力;提升整体数据链路的任务覆盖广度与深度; 2、通过数据主动合成探索数据闭环实现路径;提升交付自动化程度与质量;