LLM Consistent Reasoning

LLM Consistent Reasoning（LLM 一致性推理）是通过迭代条件更新确保 LLM 在相关问题集合上产生逻辑一致答案的推理范式。Large Language Gibbs 将其形式化为在隐式联合分布上的 Gibbs 采样。

动机

标准 LLM 推理通常独立处理每个问题，但许多问题之间存在约束关系：

独立处理导致不一致——例如对 "太阳是最亮的恒星" 和 "天狼星是最亮的恒星" 同时回答 "True"。

将每个问题-答案对视为一个二元变量 X_i ∈ {True, False}，整个问题集合为 X = (X_1, ..., X_n)。通过 Gibbs 采样迭代更新：

关键效果：当 LLM"知道"某些事实间的逻辑关系时（如 "Polaris" 和 "North Star" 是同一颗星），Gibbs 迭代会逐渐消除不一致——即使 LLM 从未被显式告知这个约束。

Wen et al. (2025) 的 ICM 通过近似最大化 sum of conditional log-probabilities 来实现一致性，是一种启发式算法。Gibbs 一致性推理的优势：

Large Language Gibbs 在 TruthfulQA 和 GSM8K-Verification 上验证：Gibbs 迭代更新相比独立推理（Zero-shot）和多轮顺序推理（k-Pass），能更好地维持答案间的一致性。