Files
myWiki/papers/gram-generative-recursive-reasoning-paper.md
2026-06-01 10:46:01 +08:00

2.9 KiB
Raw Blame History

title, created, updated, type, tags, sources, confidence
title created updated type tags sources confidence
Generative Recursive Reasoning (GRAM) 2026-05-23 2026-05-23 paper
reasoning
recursive
generative
latent-variable
inference-scaling
raw/papers/gram-generative-recursive-reasoning-2026.md
high

Generative Recursive Reasoning

核心问题:未来的神经推理系统如何实现扩展计算?答案:将递归推理从确定性单轨迹升级为概率性多轨迹计算。

基本信息

动机RRM 的确定性困境

recursive-reasoning-models(如 HRM、TRM通过共享转移函数的迭代潜在状态精炼来实现扩展计算而非像自回归模型那样延长生成序列。但现有 RRM 是确定性的——相同输入总是产生相同的单条推理路径,收敛到唯一预测。

这在需要多假设探索多解恢复的问题中是致命的:

  • 单一精炼路径可能被困在次优推理轨迹中
  • 无法在推理时进行并行扩展

GRAM概率性递归推理

gram-generative-recursive-reasoning 的核心将推理过程重新定义为随机潜在轨迹stochastic-latent-trajectory

  • 每个递归步采样一个条件于输入和当前状态的转移,而非确定性更新
  • 重复过程 -> 推理轨迹上的分布
  • 通过边缘化所有轨迹得到最终预测

三种关键能力

能力 实现方式
多假设维持 从分布中采样多条推理路径
替代策略探索 不同轨迹探索不同解空间
inference-time-scaling 增加递归深度 + 并行采样轨迹

双向生成能力

  • 条件推理: p_theta(y|x) — 给定输入,边缘化推理轨迹
  • 无条件生成: p_theta(x) — 固定/缺失输入时,同一个递归过程可生成数据

架构:双层嵌套递归

  • 内层Inner Loop: K 次低层精炼,产生确定性提议 u_t加上随机引导 eps_t -> h_t = u_t + eps_t
  • 外层Outer Loop: N_sup 个 supervision step 递归叠加
  • 训练: amortized-variational-inferenceCE loss + KL divergence

实验

任务 考察维度
Sudoku-Extreme 硬约束下的结构化推理
ARC-AGI 抽象变换
N-Queens + Graph Coloring [[multi-solution-recovery
Binarized MNIST 无条件生成能力

与推理扩展方向的关系

GRAM 提供了一条与 Chain-of-Thought 和扩散推理都互补的路径:

  • CoT = 显式 token 级扩展
  • Diffusion Reasoning = 连续空间扩散
  • GRAM = 离散潜在空间中的随机递归

详见 deep-and-wide-reasoning