Files
myWiki/concepts/dynamic-state-evolution.md

1.9 KiB
Raw Blame History

title, created, updated, type, tags, sources
title created updated type tags sources
Dynamic State Evolution 2026-06-18 2026-06-18 concept
rwkv
state-tracking
recurrence
sequence-modeling
https://arxiv.org/abs/2503.14456

Dynamic State Evolution

定义

Dynamic State Evolution动态状态演化是 RWKV-7 对序列模型中隐状态更新机制的重新表述。在传统 RNNLSTM/GRU和 LTI SSMS4状态演化规则是固定的RWKV-7 通过 generalized-delta-rule 使状态演化变为输入依赖 + 向量值 + 可学习的三维动态过程。

核心组成

S_t = S_{t-1} · (diag(w_t) - κ̂^T (a_t ⊙ κ̂)) + v_t^T · k_t
         ↑                             ↑
    状态衰减(门控)              新信息写入Delta

三部分协同:

  1. 动态衰减diag(w_t)):逐通道、输入依赖的遗忘 → vector-valued-gating
  2. 选择性移除κ̂^T (a_t ⊙ κ̂)):基于内容匹配的旧信息擦除 → in-context-learning-rate
  3. 新信息写入v_t^T · k_t):通过外积将新 (k, v) 对写入状态 → delta-rule

表达力来源

传统 RNN 的状态演化局限于标量门控 → 表达能力受限于 TC^0。

RWKV-7 的动态状态演化实现了三个突破:

  • 向量值门控 → 逐通道差异化更新
  • 广义特征值 → 进化矩阵可拥有 [0,1] 外的特征值
  • Delta 规则 → 梯度下降式的联想记忆写入

这些共同使 RWKV-7 首次实现了超越 TC^0 的并行化 RNN 表达力 → 达到 NC^1。

相关概念

参考