Files
myWiki/concepts/dynamic-state-evolution.md

53 lines
1.9 KiB
Markdown
Raw Blame History

This file contains ambiguous Unicode characters

This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.

---
title: "Dynamic State Evolution"
created: 2026-06-18
updated: 2026-06-18
type: concept
tags: ["rwkv", "state-tracking", "recurrence", "sequence-modeling"]
sources: ["https://arxiv.org/abs/2503.14456"]
---
# Dynamic State Evolution
## 定义
Dynamic State Evolution动态状态演化是 RWKV-7 对序列模型中隐状态更新机制的重新表述。在传统 RNNLSTM/GRU和 LTI SSMS4状态演化规则是固定的RWKV-7 通过 [[generalized-delta-rule]] 使状态演化变为**输入依赖 + 向量值 + 可学习**的三维动态过程。
## 核心组成
```
S_t = S_{t-1} · (diag(w_t) - κ̂^T (a_t ⊙ κ̂)) + v_t^T · k_t
↑ ↑
状态衰减(门控) 新信息写入Delta
```
三部分协同:
1. **动态衰减**`diag(w_t)`):逐通道、输入依赖的遗忘 → [[vector-valued-gating]]
2. **选择性移除**`κ̂^T (a_t ⊙ κ̂)`):基于内容匹配的旧信息擦除 → [[in-context-learning-rate]]
3. **新信息写入**`v_t^T · k_t`):通过外积将新 (k, v) 对写入状态 → [[delta-rule]]
## 表达力来源
传统 RNN 的状态演化局限于标量门控 → 表达能力受限于 TC^0。
RWKV-7 的动态状态演化实现了三个突破:
- **向量值门控** → 逐通道差异化更新
- **广义特征值** → 进化矩阵可拥有 [0,1] 外的特征值
- **Delta 规则** → 梯度下降式的联想记忆写入
这些共同使 RWKV-7 首次实现了超越 TC^0 的并行化 RNN 表达力 → 达到 NC^1。
## 相关概念
- [[generalized-delta-rule]] — 动态状态演化的完整数学形式
- [[vector-valued-gating]] — 演化的衰减部分
- [[in-context-learning-rate]] — 演化的更新速度控制
- [[regular-language-recognition]] — 动态演化的理论成果
- [[state-tracking]] — 演化支持的核心能力
- [[peng-rwkv7|RWKV-7 论文]]
## 参考
- [[peng-rwkv7|RWKV-7 "Goose"]] (Peng et al., 2025)