20260625:很多新内容

This commit is contained in:
2026-06-25 14:08:47 +08:00
parent 91fac5b6fc
commit 6021dea160
375 changed files with 19263 additions and 251 deletions

46
concepts/adkv.md Normal file
View File

@@ -0,0 +1,46 @@
---
title: "AdaKV"
created: 2026-06-18
updated: 2026-06-18
type: concept
tags: ["kv-cache", "cross-head-budget-allocation", "dynamic-allocation"]
sources: []
---
# AdaKV
## 定义
AdaKV (Feng et al., 2026b) 是一种动态的 [[cross-head-budget-allocation]] 方法,通过全局 Top-K 选择在 attention head 之间分配缓存预算。它基于注意力熵等实时统计量动态调整分配。
## 核心机制
1. **全局池化**:将所有 head 的候选 token 及其代理分数集中
2. **全局 Top-K**:跨所有 head 选择分数最高的 K 个 token
3. **动态分配**:各 head 的实际预算由 Top-K 选择结果自然决定
## 与 LU-KV 的关系
LU-KV 论文对 AdaKV 进行了关键性分析:
- **借鉴**AdaKV 的输出扰动界分析启发了 [[oracle-importance]] 的定义
- **超越**AdaKV 基于**原始代理分数**做全局比较(假设分数跨 head 可比LU-KV 基于**边际效用曲线**做跨 head 比较
- **形式化差异**AdaKV 的贪心策略未考虑 [[optimality-gap]]LU-KV 显式优化它
## 局限性
1. **分数不可比假设**:不同 head 的注意力分数尺度和分布不同,直接全局 Top-K 可能偏向分数尺度大的 head
2. **瞬时视角**:使用当前注意力熵,无法捕捉 [[long-horizon-utility]]
3. **无离线 profiling**:每次推理需在线计算,但开销仍可接受
## 相关概念
- [[cross-head-budget-allocation]] — AdaKV 所在的类别
- [[pyramidkv]] — 静态分配的替代方案
- [[global-combinatorial-optimization]] — LU-KV 采用的形式化更强的优化框架
- [[tang-lukv|LU-KV]] — 基于边际效用的改进方法
## 参考
- AdaKV (Feng et al., 2026b)
- [[tang-lukv|LU-KV]] (Tang et al., ICML 2026)