38 lines
1.5 KiB
Markdown
38 lines
1.5 KiB
Markdown
---
|
||
title: "System 2 思维"
|
||
domain: "Cognitive Science / AI"
|
||
tags: [system-2, reasoning, cognitive-science, kahneman]
|
||
sources: [[thinking-with-visual-primitives]]
|
||
---
|
||
|
||
# System 2 思维
|
||
|
||
> Daniel Kahneman 提出的双过程理论中的慢速、审慎、逻辑推理模式——多模态 AI 推理的理想目标。
|
||
|
||
## 双过程理论
|
||
|
||
| 系统 | 特征 | 速度 | 认知负荷 |
|
||
|------|------|------|----------|
|
||
| System 1 | 直觉、自动、快速 | 快 | 低 |
|
||
| **System 2** | 分析、审慎、逻辑 | 慢 | 高 |
|
||
|
||
## 在 MLLM 中的映射
|
||
|
||
- **System 1** ≈ 直接看图回答问题(zero-shot)
|
||
- **System 2** ≈ [[chain-of-thought|思维链]] + [[visual-primitives|视觉原语]] 增强的多步推理
|
||
|
||
「Thinking with Visual Primitives」的目标是实现 **System-2 式多模态智能**:模型不仅「看到」,还能在视觉空间中逐步推理、验证、回溯。
|
||
|
||
## 视觉原语与 System 2
|
||
|
||
视觉原语([[visual-primitives|视觉原语]])使 System 2 推理在视觉空间可行:
|
||
- **框原语**:系统性地扫描、锚定、计数
|
||
- **点原语**:逐步探索(DFS)、回溯、找到最优路径
|
||
|
||
这模拟了人类在 System 2 模式下的「用手指数、画辅助线」等空间认知策略。
|
||
|
||
## 相关概念
|
||
|
||
- [[chain-of-thought|思维链]] — System 2 在语言空间的表现
|
||
- [[visual-primitives|视觉原语]] — System 2 在视觉空间的扩展
|
||
- [[maze-navigation|迷宫导航]] — System 2 空间推理的典型任务 |