logo of tongyi

通义研究型实习生-大语言模型多智能体研究

实习兼职通义研究型实习生地点:北京 | 杭州 | 上海状态:招聘

任职要求


候选人应为:
1.计算机及相关专业的博士或硕士研究生,且大模型技术及其应用充分的兴趣;
2.加分项:有相关研发经验;
3.需要产出论文和专利等高水平的学术成果。

工作职责


随着人工智能技术的发展,尤其是自然语言处理领域的大语言模型的突破,为企业和个人带来了前所未有的机遇。在这一背景下,大语言模型智能体的应用成为推动业务创新的关键驱动力。 为了进一步推动大语言模型智能体的发展和应用,本项目将聚焦以下几个方面: 

1. 增强智能体的多功能性和灵活性:目前,大语言模型智能体已经能够在多个场景中发挥作用,但是其功能性和灵活性仍有待提升。我们希望通过持续的模型训练和微调,使智能体能够更好地理解和响应用户的多样化需求,从而提供更加精准的服务。 

2. 工具学习和集成:智能体需要能够学习和利用外部工具来完成特定任务。这包括但不限于数据检索、数据分析、第三方API调用等。我们计划开发一套工具学习框架,使得智能体能够自动识别哪些工具对于完成特定任务最有帮助,并能够有效地调用这些工具。
包括英文材料
大模型+
相关职位

logo of antgroup
实习研究型实习生

研究领域: 人工智能 项目简介: 【攻击】蚁鉴作为蚁天鉴大模型安全一体化解决方案的重要组成部份之一,聚焦于大语言模型潜在输出内容安全的主动挖掘和模型安全能力的量化评测。随着大模型的应用场景不断扩增,使用场景不断多样化,模态增加,agent组件增加,其暴露出来的潜在风险问题也随之扩大。我们希望通过建立一套自动化选件红队体系,挖掘更多的风险,研发更高攻击成功率的方法。从而更快,更全面地发现风险,评估风险,解决风险。当前评测遇到挑战: 1、如何批量的自动发现扫描未知的安全风险; 2、多模态agent 大模型安全评测方案设计; 3、如何对非API的复杂智能体(例如支小宝)进行评测; 4、大模型其他安全问题的研究,例如:能耗攻击,后门,可解释性等; 【防御】大模型对齐作为蚁天鉴安全护栏核心能力之一,对于不安全或者有攻击性的query,在response的价值观等安全性方面往往能表现出更加优秀的性能,在安全链路中发挥着及其重要的作用。 然而,内容安全大模型依然存在大模型的不足: 1. 与语言模型相比,多模内容安全大模型在内容的理解和生成存在许多跨域风险的理解与对齐问题。 2. 幻觉问题,对于一些低频知识依然存在幻觉,特别是在涉政场景,幻觉问题的影响会被放大。 3. 模型难以可控生成,对于一些紧急badcase修复和业务调整依然需要大量数据重新训练成本较高,无法进行及时高效地局部模型知识更新。 4. 推理模型安全性研究与防控。

logo of tongyi
实习通义研究型实习生

当前大模型(LLMs/MLLMs)在长对话和复杂任务链中面临上下文窗口限制和遗忘问题。尽管扩大上下文长度有所帮助,但其计算和推理成本高昂,且难以实现真正意义上的终身学习和经验累积。另一方面,现有模型在交互中往往缺乏个性化的体验,无法有效地捕捉、存储和召回与特定用户、特定场景相关的多模态经验。为了使大模型具备像人类一样从持续交互中学习、积累和灵活调度的能力,并实现从通用助手到私人智能伙伴的跃升,亟需构建一个高效、多层次、时间敏感的多模态记忆系统。这不仅能突破输入长度限制,还能通过跨模态信息的整合和知识的结构化,大幅提升模型在复杂场景下的鲁棒性、泛化能力和自我进化能力。 大模型多模态记忆增强研究项目,团队在多个方向上进行探索,若你对以下一个或多个课题感兴趣均欢迎投递: 1. 多层次记忆的构建与管理 2. 多模态记忆的嵌入与召回 3. 时间敏感的记忆调度策略 4. 记忆智能体(Memory Agent)的构建

更新于 2025-10-17
logo of tongyi
实习通义研究型实习生

在大模型技术日臻成熟与广泛应用的背景下,自动代码生成的研究步入了一个全新的阶段。近年来,随着大规模预训练语言模型(如GPT系列、通义千问系列)的突破性发展,以及多智能体系统(Multi-Agent Systems, MAS)在复杂环境决策和协同任务处理中的深入探索,如何结合这两者的优点,构建具备高度环境感知能力的Code Multi-Agent系统,已成为软件工程和人工智能交叉领域的重要课题。因此,针对Code Multi-Agent系统在项目环境感知方面的研究,不仅能够填补现有工具在智能化程度上的空白,更有望引领软件工程实践进入一个崭新的自动化与智能化时代。

更新于 2025-02-08
logo of tongyi
实习通义研究型实习生

专注于多模态智能体(Agent)及强化学习(RL)的研究与开发,如 browser use 等,推动下一代智能决策系统的创新。主要职责包括: 1. 设计和构建基于 Qwen 系列模型的多模态 Agent,使其能够高效处理文本、图像、视频等多种信息,执行复杂任务; 2. 实现和训练强化学习算法,探索如何在多模态环境下优化智能体的决策策略; 3. 开发数据采集和环境建模工具,构建逼真的多模态交互环境; 4. 参与系统评估与优化,设计高效的验证机制,确保智能体的稳定性与泛化能力; 5. 撰写研究论文、技术文档,与团队共同推动技术突破,并提升行业影响力。

更新于 2025-08-15