SidneyZhang/myWiki

Files

Sidney Zhang 6021dea160

20260625:很多新内容

2026-06-25 14:08:47 +08:00

1.6 KiB

Raw Blame History

title, created, updated, type, tags, sources

title

created

updated

type

tags

sources

状态追踪 (State Tracking)

2026-06-18

2026-06-18

concept

transformers

recurrence

state

mozer-topological-trouble-transformers-2026

状态追踪 (State Tracking)

状态追踪指迭代更新反映变化环境的潜变量的过程。这是语言理解和推理的核心能力——追踪不断变化的世界状态、参数结构和社交互动。

核心机制

与 Transformer 的上下文检索不同，状态追踪要求（Mozer et al., 2026）：

迭代更新：s_t = f(s_{t-1}, x_t)，新状态依赖前序状态
顺序依赖：无法完全并行化，存在本质的串行瓶颈
压缩表示：将历史信息持续压缩到紧凑的信念状态中

典型失败模式

Twenty Questions 不一致：模型无法维持一致的隐藏数字范围
多义词翻转 (bank flip-flop)：对 "bank" 的解释在 river bank → money bank 之间无意识切换
多轮对话失去连贯性（Laban et al., 2025）
多智能体通信崩溃（Davidson et al., 2025）

与前馈架构的冲突

前馈 Transformer 的拓扑结构天然限制了状态追踪（见 feedforward-depth-limitation）：状态被迫逐层上移，最终耗尽模型深度。

人类认知对比

人类通过动态系统隐式维护状态（无意识、自动化的微认知），而不是像 Chain-of-Thought 那样显式写出思维轨迹。

参考