Dynamic State Evolution

定义

Dynamic State Evolution（动态状态演化）是 RWKV-7 对序列模型中隐状态更新机制的重新表述。在传统 RNN（LSTM/GRU）和 LTI SSM（S4）中，状态演化规则是固定的；RWKV-7 通过 generalized-delta-rule 使状态演化变为输入依赖 + 向量值 + 可学习的三维动态过程。

核心组成

S_t = S_{t-1} · (diag(w_t) - κ̂^T (a_t ⊙ κ̂)) + v_t^T · k_t
         ↑                             ↑
    状态衰减（门控）              新信息写入（Delta）

三部分协同：

动态衰减（diag(w_t)）：逐通道、输入依赖的遗忘 → vector-valued-gating
选择性移除（κ̂^T (a_t ⊙ κ̂)）：基于内容匹配的旧信息擦除 → in-context-learning-rate
新信息写入（v_t^T · k_t）：通过外积将新 (k, v) 对写入状态 → delta-rule

表达力来源

传统 RNN 的状态演化局限于标量门控 → 表达能力受限于 TC^0。

RWKV-7 的动态状态演化实现了三个突破：

向量值门控 → 逐通道差异化更新
广义特征值 → 进化矩阵可拥有 [0,1] 外的特征值
Delta 规则 → 梯度下降式的联想记忆写入

这些共同使 RWKV-7 首次实现了超越 TC^0 的并行化 RNN 表达力 → 达到 NC^1。

参考

peng-rwkv7 (Peng et al., 2025)

1.9 KiB Raw Blame History Unescape Escape

Dynamic State Evolution

定义

核心组成

表达力来源

相关概念

参考

1.9 KiB

Raw Blame History