20260625:很多新内容
This commit is contained in:
57
concepts/heuristic-metric.md
Normal file
57
concepts/heuristic-metric.md
Normal file
@@ -0,0 +1,57 @@
|
||||
---
|
||||
title: "Heuristic Metric (KV Cache)"
|
||||
created: 2026-06-18
|
||||
updated: 2026-06-18
|
||||
type: concept
|
||||
tags: ["kv-cache", "evaluation-metric", "attention"]
|
||||
sources: ["https://arxiv.org/abs/2602.08585"]
|
||||
---
|
||||
|
||||
# Heuristic Metric
|
||||
|
||||
## 定义
|
||||
|
||||
Heuristic Metric(启发式指标)是 LU-KV 论文中的术语,指在 KV Cache 驱逐中用于评估 token 重要性的所有**可在线计算的近似指标**(如注意力分数、Key 向量几何特征等)。与 [[oracle-importance]] 不同,启发式指标可以在推理中实时计算,但无法完美预测 token 的[[long-horizon-utility]]。
|
||||
|
||||
## 代表性启发式指标
|
||||
|
||||
| 指标 π | 计算方式 | 核心假设 |
|
||||
|---------|---------|---------|
|
||||
| SnapKV (π_1) | 累积注意力分数 + 观察窗口 | 高注意力 token 持续重要 |
|
||||
| KeyDiff (π_2) | Key 向量差分模式 | 几何异常 token 更重要 |
|
||||
| CAKE | 空间分散度 + 任务先验 | 分层级联规则 |
|
||||
| KVZip | 上下文重构误差 | 重构关键 token 最重要 |
|
||||
|
||||
## 根本局限
|
||||
|
||||
所有启发式指标共享一个**结构性问题**:
|
||||
|
||||
```
|
||||
π(token) ≠ π*(token) (启发式分数 ≠ Oracle 重要性)
|
||||
```
|
||||
|
||||
且偏差程度在不同 attention head 中不同:
|
||||
|
||||
- 某些 head:π 与 π* 高度一致 → 驱逐高效
|
||||
- 某些 head:π 与 π* 严重失配 → 大量 False Positives 和 Misses → [[optimality-gap]]
|
||||
|
||||
## LU-KV 的应对
|
||||
|
||||
LU-KV 不试图改进启发式指标本身,而是:
|
||||
|
||||
1. 接受 π 的不完美性
|
||||
2. 通过 [[offline-profiling]] 标定每个 head 中 π 的可靠性
|
||||
3. 将更多预算分配给 π 可靠性高的 head(高[[marginal-utility]])
|
||||
4. 减少 π 可靠性低的 head 的预算(低边际效用)
|
||||
|
||||
这是**指标无关(Metric-Agnostic)**设计:任意 π 都可以作为 LU-KV 的输入。
|
||||
|
||||
## 相关概念
|
||||
|
||||
- [[oracle-importance]] — 启发式指标的理想参考标准
|
||||
- [[optimality-gap]] — π 与 π* 的差距导致的额外损失
|
||||
- [[intra-head-eviction]] — 启发式指标的主要应用场景
|
||||
|
||||
## 参考
|
||||
|
||||
- [[tang-lukv|LU-KV]] (Tang et al., ICML 2026)
|
||||
Reference in New Issue
Block a user