连续表征 (Continuous Representation)

连续表征是 latent-reasoning 的数学基础——在 LLM 推理中使用高维连续向量而非离散 token 来表示推理状态。

形式

在 Transformer 架构中，连续的隐藏状态 h_t ∈ R^d 天然存在于每一层的输出中。标准 chain-of-thought 将这些 d 维连续向量坍缩为 1 个离散 token，而潜在推理直接操作这些连续表征。

u_continuous = h_t（Transformer 最后一层输出）

u_continuous = sum w_i * E(v_i)（top-k embedding 加权混合）

连续表征是确定性的（给定相同输入，输出相同向量），这与离散 token 采样形成根本对立：

这种确定性限制了 RL 策略探索，催生了 reparameterization-exploration 和 hybrid-reasoning 两条解决路线。