Generative Reconstruction (GR)

Generative Reconstruction (GR) 是 space-supervision 中的一种策略，通过辅助解码器从潜状态恢复显式推理步骤，在符号空间中做语义锚定。与 geometric-compression-latent 的刚性潜空间约束形成对比。

机制

在 Latent CoT 中，每个潜状态 L_t 对应一个显式推理步骤 S_t。GR 训练一个专用解码器 D_ψ：

L_GR = -log D_ψ(S_t | L_t)

即标准交叉熵重建损失——L_t 被鼓励保留足够信息来恢复原始文本。

GR 直接最小化条件熵 H(S_t | L_t)：

I(L_t; S_t) = H(S_t) - H(S_t | L_t)

由于 H(S_t) 固定，GR 严格最大化 I(L_t; S_t) 的变分下界。

核心问题：高维空间中，MSE 无法约束方向对齐——误差可以分散到无关维度，保持低逐元素损失同时完全失去语义。

GR 的解决方案：通过在 token 空间中重建，每个输出维度（词表 token）独立受监督，迫使潜状态保留丰富的语义内容。