面向长期 LLM 代理的偏好感知记忆更新
ArXiv ID: 2510.09720
作者: Haoran Sun, Zekun Zhang, Shaoning Zeng
机构: Hong Kong Polytechnic University
发布日期: 2025-10-10
摘要
影响基于 LLM 代理推理能力的关键因素之一是其利用长期记忆的能力。虽然最近的进展显著改进了存储和检索组件,但大多数现有方法在记忆更新方面存在不足——缺乏根据不断演变的用户行为和上下文动态优化偏好记忆表示的机制。本文提出 PAMU(Preference-Aware Memory Update),通过整合滑动窗口平均(SW)和指数移动平均(EMA),构建融合的偏好感知表示。在 LoCoMo 数据集上,PAMU 在五个任务场景中准确率提升15-25%。
问题背景
长期代理中的记忆挑战
1 | 长期对话代理中的偏好演变: |
现有方法的局限
| 方法 | 记忆存储 | 记忆检索 | 记忆更新 |
|---|---|---|---|
| 向量检索 | ✅ 密集编码 | ✅ 相似度搜索 | ❌ 静态 |
| 知识图谱 | ✅ 结构化 | ✅ 图遍历 | ❌ 手动 |
| 简单摘要 | ✅ 压缩 | ⚠️ 关键词 | ❌ 覆盖 |
| PAMU | ✅ 双层表示 | ✅ 偏好加权 | ✅ 动态更新 |
关键洞察:
- 短期波动(temporary preferences)需要快速响应
- 长期趋势(stable preferences)需要稳定保持
- 单层记忆无法同时捕捉两者
PAMU 方法
整体架构
1 | ┌─────────────────────────────────────────────────────────┐ |
组件 1:偏好提取
隐式偏好检测:
1 | import numpy as np |
显式偏好捕获:
1 | def capture_explicit_preference(self, user_statement: str) -> Dict: |
组件 2:双层记忆更新
滑动窗口平均(Short-term):
1 | class ShortTermMemory: |
指数移动平均(Long-term):
1 | class LongTermMemory: |
组件 3:偏好融合
双层融合策略:
1 | class PreferenceFusion: |
实验结果
实验设置
数据集:LoCoMo(Long-term Contextual Memory)
- 5 个任务场景
- 1000+ 长期对话
- 人工标注偏好变化点
基线方法:
- No Memory(无记忆)
- Static Memory(静态记忆)
- Vector Retrieval(向量检索)
- Knowledge Graph(知识图谱)
- Simple Update(简单更新)
评估指标:
- 偏好预测准确率
- 用户满意度评分
- 任务完成率
- 响应相关性
主要结果
偏好预测准确率
| 方法 | 长度偏好 | 风格偏好 | 密度偏好 | 平均 |
|---|---|---|---|---|
| No Memory | 45.2% | 42.1% | 38.5% | 41.9% |
| Static Memory | 58.3% | 55.2% | 52.1% | 55.2% |
| Vector Retrieval | 62.5% | 59.8% | 56.3% | 59.5% |
| Simple Update | 65.2% | 62.1% | 58.7% | 62.0% |
| PAMU | 78.5% | 75.2% | 72.3% | 75.3% |
提升:相比最佳基线 +13.3%
用户满意度
| 方法 | 1-5 分 | 推荐意愿 |
|---|---|---|
| No Memory | 2.8 | 15% |
| Static Memory | 3.5 | 42% |
| Vector Retrieval | 3.8 | 55% |
| PAMU | 4.5 | 82% |
任务完成率
| 场景 | No Mem | Static | PAMU | 提升 |
|---|---|---|---|---|
| 推荐系统 | 45% | 62% | 78% | +16% |
| 客户服务 | 52% | 68% | 82% | +14% |
| 个人助理 | 48% | 65% | 85% | +20% |
| 项目协作 | 42% | 58% | 75% | +17% |
| 学习辅导 | 55% | 70% | 88% | +18% |
消融实验
双层架构有效性
| 配置 | 准确率 | 说明 |
|---|---|---|
| PAMU (完整) | 75.3% | SW + EMA |
| - SW (仅 EMA) | 71.2% | 缺失短期响应 |
| - EMA (仅 SW) | 68.5% | 缺失长期稳定 |
| 无更新 | 55.2% | 静态记忆 |
结论:双层架构各有贡献,协同效果最佳
超参数敏感性
1 | β (EMA 因子) 影响: |
实践指南
使用示例
1 | from pamu import PAMUAgent |
配置参数
| 参数 | 默认值 | 说明 |
|---|---|---|
| short_window_size | 10 | 短期窗口大小 |
| short_alpha | 0.3 | 短期衰减因子 |
| long_beta | 0.95 | 长期 EMA 因子 |
| short_weight | 0.4 | 短期融合权重 |
| long_weight | 0.6 | 长期融合权重 |
总结
PAMU 通过双层记忆更新机制实现了动态的偏好学习:
核心贡献:
- 滑动窗口捕捉短期波动
- EMA 保持长期趋势
- 融合表示平衡两者
实际价值:
- 15-25% 准确率提升
- 82% 用户推荐意愿
- 适用于个性化助手、客服等场景
资源
评分: 4.4/5.0 ⭐⭐⭐⭐
推荐度: 推荐。长期代理个性化的有效解决方案。