Files
myWiki/concepts/heuristic-metric.md

2.0 KiB
Raw Blame History

title, created, updated, type, tags, sources
title created updated type tags sources
Heuristic Metric (KV Cache) 2026-06-18 2026-06-18 concept
kv-cache
evaluation-metric
attention
https://arxiv.org/abs/2602.08585

Heuristic Metric

定义

Heuristic Metric启发式指标是 LU-KV 论文中的术语,指在 KV Cache 驱逐中用于评估 token 重要性的所有可在线计算的近似指标如注意力分数、Key 向量几何特征等)。与 oracle-importance 不同,启发式指标可以在推理中实时计算,但无法完美预测 token 的long-horizon-utility

代表性启发式指标

指标 π 计算方式 核心假设
SnapKV (π_1) 累积注意力分数 + 观察窗口 高注意力 token 持续重要
KeyDiff (π_2) Key 向量差分模式 几何异常 token 更重要
CAKE 空间分散度 + 任务先验 分层级联规则
KVZip 上下文重构误差 重构关键 token 最重要

根本局限

所有启发式指标共享一个结构性问题

π(token) ≠ π*(token)  (启发式分数 ≠ Oracle 重要性)

且偏差程度在不同 attention head 中不同:

  • 某些 headπ 与 π* 高度一致 → 驱逐高效
  • 某些 headπ 与 π* 严重失配 → 大量 False Positives 和 Misses → optimality-gap

LU-KV 的应对

LU-KV 不试图改进启发式指标本身,而是:

  1. 接受 π 的不完美性
  2. 通过 offline-profiling 标定每个 head 中 π 的可靠性
  3. 将更多预算分配给 π 可靠性高的 headmarginal-utility
  4. 减少 π 可靠性低的 head 的预算(低边际效用)

这是**指标无关Metric-Agnostic**设计:任意 π 都可以作为 LU-KV 的输入。

相关概念

参考