PyramidKV

定义

PyramidKV (Cai et al., 2024) 是一种静态的 cross-head-budget-allocation 方法，基于"信息漏斗"（Information Funneling）假说，采用固定的金字塔形预算分布：浅层保留更多 token，深层逐渐减少。

注意力信息从浅层向深层逐渐"漏斗式"汇聚——深层需要的 KV 信息量更少。

基于此，PyramidKV 使用固定的逐层预算模式，无需在线计算。

b_layer_1 > b_layer_2 > ... > b_layer_L  （逐层递减的金字塔形）

这是一个静态规则，不依赖 token 内容或注意力模式。

LU-KV 论文指出 PyramidKV 的三个局限：

作为 cross-head-budget-allocation baseline 之一，PyramidKV 在 LongBench 和 RULER 上的表现系统性地弱于 LU-KV，验证了全局组合优化的价值。