选择性状态空间模型 (Selective SSM)

选择性 SSM 是 Mamba (Gu & Dao, 2023) 引入的关键创新：将 SSM 的参数 (A_t, B_t, C_t) 从时间不变（LTI）改为输入依赖（时变）。

从 LTI 到 Selective

h_t = A · h_{t-1} + B · x_t    [A, B, C 对所有 t 相同]

h_t = A_t · h_{t-1} + B_t · x_t    [A_t, B_t, C_t 依赖 x_t]

Mamba-2 (Dao & Gu, 2024) 对选择性 SSM 做了两个简化：

这些简化换取的是 ssd-algorithm 的巨大效率收益（2-8x 更快）和 GPU Tensor Core 的利用。

尽管 LTI SSM 在表达能力上不超标准 Transformer（Merrill et al., 2025），选择性机制通过输入依赖门控突破了此限制——这在 enhanced-state-space-models 中得到了进一步发展。