--- title: "Generative Recursive Reasoning (GRAM)" created: 2026-05-23 updated: 2026-05-23 type: paper tags: [reasoning, recursive, generative, latent-variable, inference-scaling] sources: [raw/papers/gram-generative-recursive-reasoning-2026.md] confidence: high --- # Generative Recursive Reasoning > 核心问题:未来的神经推理系统如何实现**扩展计算**?答案:将递归推理从确定性**单轨迹**升级为概率性**多轨迹**计算。 ## 基本信息 - **作者**: Junyeob Baek, Mingyu Jo, Minsu Kim, Mengye Ren, Yoshua Bengio, Sungjin Ahn(KAIST x Mila x NYU x UdeM) - **arXiv**: [2605.19376](https://arxiv.org/abs/2605.19376) (v2, 2026-05-19) - **领域**: cs.AI - **项目页**: https://ahn-ml.github.io/gram-website ## 动机:RRM 的确定性困境 **[[recursive-reasoning-models|RRM]]**(如 HRM、TRM)通过共享转移函数的迭代潜在状态精炼来实现扩展计算,而非像自回归模型那样延长生成序列。但现有 RRM 是**确定性的**——相同输入总是产生相同的单条推理路径,收敛到唯一预测。 这在需要**多假设探索**和**多解恢复**的问题中是致命的: - 单一精炼路径可能被困在次优推理轨迹中 - 无法在推理时进行并行扩展 ## GRAM:概率性递归推理 **[[gram-generative-recursive-reasoning|GRAM]]** 的核心将推理过程重新定义为**随机潜在轨迹**([[stochastic-latent-trajectory]]): - 每个递归步采样一个**条件于输入和当前状态的转移**,而非确定性更新 - 重复过程 -> 推理轨迹上的**分布** - 通过**边缘化**所有轨迹得到最终预测 ### 三种关键能力 | 能力 | 实现方式 | |------|---------| | 多假设维持 | 从分布中采样多条推理路径 | | 替代策略探索 | 不同轨迹探索不同解空间 | | [[inference-time-scaling]] | 增加递归深度 + 并行采样轨迹 | ### 双向生成能力 - **条件推理**: p_theta(y|x) — 给定输入,边缘化推理轨迹 - **无条件生成**: p_theta(x) — 固定/缺失输入时,同一个递归过程可生成数据 ## 架构:双层嵌套递归 - **内层(Inner Loop)**: K 次低层精炼,产生确定性提议 u_t,加上随机引导 eps_t -> h_t = u_t + eps_t - **外层(Outer Loop)**: N_sup 个 supervision step 递归叠加 - 训练: [[amortized-variational-inference|摊销变分推断]](CE loss + KL divergence) ## 实验 | 任务 | 考察维度 | |------|---------| | Sudoku-Extreme | 硬约束下的结构化推理 | | ARC-AGI | 抽象变换 | | N-Queens + Graph Coloring | [[multi-solution-recovery|多解恢复]] | | Binarized MNIST | 无条件生成能力 | ## 与推理扩展方向的关系 GRAM 提供了一条与 Chain-of-Thought 和扩散推理都**互补**的路径: - CoT = 显式 token 级扩展 - Diffusion Reasoning = 连续空间扩散 - GRAM = **离散潜在空间中的随机递归** 详见 [[deep-and-wide-reasoning]]