logo of tongyi

通义研究型实习生 - 大模型多模态记忆增强研究

实习兼职通义研究型实习生地点:北京 | 杭州 | 上海状态:招聘

任职要求


1. 在读研究生以上学历,具备LLM/RAG/Agent研发经验,第一作者发表过顶级会议论文。
2. 扎实的算法能力,优良的编程风格,熟悉Python语言,具备复杂系统的设计开发调试能力。
3. 优良的沟通表达能力、团队合作意识和经验;具备快速学习的能力,以及深入钻研技术问题的耐心。

工作职责


当前大模型(LLMs/MLLMs)在长对话和复杂任务链中面临上下文窗口限制和遗忘问题。尽管扩大上下文长度有所帮助,但其计算和推理成本高昂,且难以实现真正意义上的终身学习和经验累积。另一方面,现有模型在交互中往往缺乏个性化的体验,无法有效地捕捉、存储和召回与特定用户、特定场景相关的多模态经验。为了使大模型具备像人类一样从持续交互中学习、积累和灵活调度的能力,并实现从通用助手到私人智能伙伴的跃升,亟需构建一个高效、多层次、时间敏感的多模态记忆系统。这不仅能突破输入长度限制,还能通过跨模态信息的整合和知识的结构化,大幅提升模型在复杂场景下的鲁棒性、泛化能力和自我进化能力。

大模型多模态记忆增强研究项目,团队在多个方向上进行探索,若你对以下一个或多个课题感兴趣均欢迎投递:
1. 多层次记忆的构建与管理
2. 多模态记忆的嵌入与召回
3. 时间敏感的记忆调度策略
4. 记忆智能体(Memory Agent)的构建
包括英文材料
学历+
大模型+
RAG+
AI agent+
算法+
Python+
相关职位

logo of tongyi
实习通义研究型实习生

1. 通过研究慢思考、multi-agent协作、大小模型协同等方法提升个性化Agent复杂任务拆解、tool调用、记忆等机制能力; 2. 通过RLHF等反馈增强技术,提升个性化大模型的风格化、复杂指令遵循等Alignment能力; 3. 研究个性化多模态对话、角色生成技术,提升多模态场景下的个性化理解和生成能力; 4. 研究多模态基础大模型基础技术,提升多模态细粒度理解、感知能力,解决多模态场景下的知识幻觉、多图in-context能力等。

更新于 2024-11-14
logo of amap
实习高德研究型实习生

职位描述 跟进AI Agent领域最新技术动态,围绕LLM大模型、Agent框架、LLM Reasoning技术(如思维链、多步推理)、优化复杂查询的Deep Research模式、长期记忆机制、自动化数据合成、指令微调(Instruction Tuning)、偏好对齐(RLHF/DPO)等技术,持续推动算法创新与落地。 开展LLM Agent技术研发,构建端到端Agent系统,涵盖意图识别、知识检索、结果生成与偏好对齐,推动相关技术研究与算法落地,提升用户体验。

更新于 2025-09-10
logo of aliyun
实习阿里云研究型实习

职位描述: 1、参与Agent系统的原型构建与落地,探索提升Agent自主理解、规划与执行任务能力的新思路与方法; 2、优化Agent的对话交互机制,尝试新颖的交互方式,以提升用户体验和任务完成的流畅性与智能性; 3、研究并实验Agent的知识整合与上下文记忆管理方案,探索更高效、智能的信息组织与检索技术,支持Agent进行更深层次的思考; 4、探索Agent与系统工具、API的智能协同策略,参与设计和验证更鲁棒、灵活的工具调用与任务规划流程,鼓励提出创新交互方案; 5、针对特定复杂场景,调研并实践Agent解决用户实际问题的创新路径,挑战并拓展Agent的能力边界。

更新于 2025-07-02
logo of tongyi
实习通义研究型实习生

大模型因其强大的语言理解和生成能力,在人工智能领域引起了广泛关注。当前,ChatGPT、LLama等关注英语的大型语言模型已经取得了显著成就。关注中文的大模型,如ChatGLM、MOSS以及千问等也正在快速发展。然而,中/英以外的语言能力关注较少,但需求和研究价值很高。

更新于 2024-01-09