增强代理长期记忆的多重记忆系统
ArXiv ID: 2508.15294
作者: Gaoke Zhang, Bo Wang, Yunlong Ma, Dongming Zhao, Zifei Yu
机构: Shandong University, Alibaba Group
发布日期: 2025-08-21
摘要
由大型语言模型驱动的代理取得了令人印象深刻的成果,但有效处理交互过程中产生的大量历史数据仍然是一个挑战。现有方法如 MemoryBank 和 A-MEM 存在记忆内容质量差的问题,影响了检索性能和响应质量。本文提出 MMS(Multiple Memory Systems) 架构,灵感来自人类认知科学的多重记忆理论。系统包含三个独立但协同工作的记忆子系统:程序性记忆、语义记忆和情节记忆。实验表明,MMS 相比单一记忆系统在响应相关性上提升35%,事实准确性提升40%。
问题背景
单一记忆系统的局限
1 | 当前代理记忆系统的问题: |
核心问题:
- 技能知识、事实信息、个人经历混为一谈
- 使用相同的存储和检索策略
- 无法模拟人类的记忆组织方式
人类记忆系统的启示
1 | 人类多重记忆系统: |
MMS 架构
整体设计
1 | ┌─────────────────────────────────────────────────────────┐ |
组件 1:程序性记忆
存储技能和操作流程:
1 | class ProceduralMemory: |
示例技能:
1 | # 存储示例 |
组件 2:语义记忆
知识图谱组织:
1 | import networkx as nx |
组件 3:情节记忆
时序索引的经历存储:
1 | class EpisodicMemory: |
记忆融合与验证
1 | class MemoryFusion: |
实验结果
实验设置
任务场景:
- 客户服务对话(500+ 轮)
- 项目管理协作(30 天 +)
- 个人助理(长期交互)
对比方法:
- MemoryBank
- A-MEM
- 单一记忆池
- RAG 基线
评估指标:
- 响应相关性(1-5 分)
- 事实准确性(%)
- 技能应用成功率(%)
- 用户满意度(1-5 分)
主要结果
响应质量
| 方法 | 相关性 | 准确性 | 一致性 |
|---|---|---|---|
| MemoryBank | 3.2 | 68% | 72% |
| A-MEM | 3.4 | 71% | 75% |
| 单一记忆池 | 3.1 | 65% | 70% |
| MMS | 4.5 | 88% | 91% |
提升:相比最佳基线 +35% 相关性,+40% 准确性
技能应用成功率
| 任务类型 | MemoryBank | A-MEM | MMS |
|---|---|---|---|
| 代码写作 | 62% | 65% | 82% |
| 文档撰写 | 58% | 61% | 78% |
| 数据分析 | 55% | 58% | 75% |
| 问题诊断 | 52% | 55% | 72% |
长时记忆保持
1 | 记忆保持率 vs 时间: |
消融实验
各记忆系统贡献
| 配置 | 相关性 | 准确性 |
|---|---|---|
| MMS (完整) | 4.5 | 88% |
| - 程序性记忆 | 4.1 | 85% |
| - 语义记忆 | 4.0 | 78% |
| - 情节记忆 | 4.2 | 82% |
| 单一记忆池 | 3.1 | 65% |
总结
MMS 通过模拟人类多重记忆系统,实现了更高效的代理记忆管理:
核心贡献:
- 程序性、语义、情节三系统分离设计
- 针对性存储和检索策略
- 交叉验证提高记忆质量
实际价值:
- 35% 响应相关性提升
- 40% 事实准确性提升
- 适用于长期交互代理
资源
评分: 4.4/5.0 ⭐⭐⭐⭐
推荐度: 推荐。长期代理记忆管理的创新架构。