Files
myWiki/concepts/fact-augmented-key-expansion.md

1.9 KiB
Raw Blame History

title, created, updated, type, tags, sources
title created updated type tags sources
Fact-Augmented Key Expansion 2026-06-25 2026-06-25 concept
memory
indexing
optimization
rag
longmem-eval-2025

Fact-Augmented Key Expansion

Fact-Augmented Key Expansion 是 LongMemEval 实验验证的记忆索引优化策略:在存储记忆时,用 LLM 从对话中提取的结构化事实作为索引键(而非仅对话原文)。

动机

简单用对话原文作为 key 的问题:

  • 原文含大量噪音(闲聊、过渡语)
  • 一条对话可能包含多个独立事实,但只有一个 key
  • BM25 词法匹配依赖精确 token原文可能用不同的词表达同一事实

做法

对话历史
  ↓
LLM 事实提取 → [{"fact": "用户偏好 PostgreSQL", "confidence": 0.92},
                {"fact": "用户住在深圳", "confidence": 0.95}, ...]
  ↓
结构化为 key → 存入索引(与原文 value 关联)

效果LongMemEval 实验数据)

指标 仅原文 Key +Fact Key 增益
Memory Recall@k baseline +9.4% 显著
QA Accuracy baseline +5.4% 显著

为什么有效

  1. 结构化事实消除歧义"我只用 PostgreSQL" → "数据库偏好: PostgreSQL" 比原文本 BM25 匹配更可靠
  2. 多事实拆分:一条对话可能含 3 个独立事实 → 3 个 key每个独立可召回
  3. confidence 字段支持未来过滤:低置信度事实可降低召回权重

与 Atlas Consolidation 的关系

Atlas 的 consolidation 本质上是 Fact-Augmented Key Expansion 的一种实现:

  • episodic → 原文 value
  • consolidation → 从 episodic 提取结构化事实 → 存入 semantic 索引
  • semantic 索引的 recall 就等价于 fact-augmented key expansion 的效果

参考