Files
myWiki/concepts/adkv.md

1.7 KiB
Raw Blame History

title, created, updated, type, tags, sources
title created updated type tags sources
AdaKV 2026-06-18 2026-06-18 concept
kv-cache
cross-head-budget-allocation
dynamic-allocation

AdaKV

定义

AdaKV (Feng et al., 2026b) 是一种动态的 cross-head-budget-allocation 方法,通过全局 Top-K 选择在 attention head 之间分配缓存预算。它基于注意力熵等实时统计量动态调整分配。

核心机制

  1. 全局池化:将所有 head 的候选 token 及其代理分数集中
  2. 全局 Top-K:跨所有 head 选择分数最高的 K 个 token
  3. 动态分配:各 head 的实际预算由 Top-K 选择结果自然决定

与 LU-KV 的关系

LU-KV 论文对 AdaKV 进行了关键性分析:

  • 借鉴AdaKV 的输出扰动界分析启发了 oracle-importance 的定义
  • 超越AdaKV 基于原始代理分数做全局比较(假设分数跨 head 可比LU-KV 基于边际效用曲线做跨 head 比较
  • 形式化差异AdaKV 的贪心策略未考虑 optimality-gapLU-KV 显式优化它

局限性

  1. 分数不可比假设:不同 head 的注意力分数尺度和分布不同,直接全局 Top-K 可能偏向分数尺度大的 head
  2. 瞬时视角:使用当前注意力熵,无法捕捉 long-horizon-utility
  3. 无离线 profiling:每次推理需在线计算,但开销仍可接受

相关概念

参考

  • AdaKV (Feng et al., 2026b)
  • tang-lukv (Tang et al., ICML 2026)