Generative Recursive Reasoning

条件推理: p_theta(y|x) — 给定输入，边缘化推理轨迹
无条件生成: p_theta(x) — 固定/缺失输入时，同一个递归过程可生成数据

核心问题：未来的神经推理系统如何实现扩展计算？答案：将递归推理从确定性单轨迹升级为概率性多轨迹计算。

基本信息

作者: Junyeob Baek, Mingyu Jo, Minsu Kim, Mengye Ren, Yoshua Bengio, Sungjin Ahn（KAIST x Mila x NYU x UdeM）
arXiv: 2605.19376 (v2, 2026-05-19)
领域: cs.AI
项目页: https://ahn-ml.github.io/gram-website

recursive-reasoning-models（如 HRM、TRM）通过共享转移函数的迭代潜在状态精炼来实现扩展计算，而非像自回归模型那样延长生成序列。但现有 RRM 是确定性的——相同输入总是产生相同的单条推理路径，收敛到唯一预测。

这在需要多假设探索和多解恢复的问题中是致命的：

gram-generative-recursive-reasoning 的核心将推理过程重新定义为随机潜在轨迹（stochastic-latent-trajectory）：

GRAM 提供了一条与 Chain-of-Thought 和扩散推理都互补的路径：