1.2 KiB
1.2 KiB
title, created, updated, type, tags, sources, confidence
| title | created | updated | type | tags | sources | confidence | |||||
|---|---|---|---|---|---|---|---|---|---|---|---|
| Deep-and-Wide Reasoning(深度且宽广的推理) | 2026-05-23 | 2026-05-23 | concept |
|
|
high |
Deep-and-Wide Reasoning
GRAM 的设计哲学:未来的推理系统不应只是深(重复精炼),还应宽(维持和探索多条并行潜在轨迹)。
为什么深度不够
单一精炼路径的局限:
- 可能被困在次优推理轨迹中
- 无法同时考虑多个假设
- 在多解问题上只能返回一个解
Deep + Wide 的互补关系
- Deep(递归深度): 单条轨迹上的推理精炼质量
- Wide(轨迹宽度): 推理空间的探索覆盖度
两者正交且互补——可以独立调参来适配不同类型的问题。
设计原则
好的 RRM 需要同时支持:
- 通过多次递归步骤充分精炼单条推理路径
- 通过随机采样探索多个可能的推理方向
- 在 inference time 灵活分配 depth 和 width 的预算