1.5 KiB
1.5 KiB
title, domain, tags, sources
| title | domain | tags | sources | ||||||
|---|---|---|---|---|---|---|---|---|---|
| System 2 思维 | Cognitive Science / AI |
|
|
System 2 思维
Daniel Kahneman 提出的双过程理论中的慢速、审慎、逻辑推理模式——多模态 AI 推理的理想目标。
双过程理论
| 系统 | 特征 | 速度 | 认知负荷 |
|---|---|---|---|
| System 1 | 直觉、自动、快速 | 快 | 低 |
| System 2 | 分析、审慎、逻辑 | 慢 | 高 |
在 MLLM 中的映射
- System 1 ≈ 直接看图回答问题(zero-shot)
- System 2 ≈ chain-of-thought + visual-primitives 增强的多步推理
「Thinking with Visual Primitives」的目标是实现 System-2 式多模态智能:模型不仅「看到」,还能在视觉空间中逐步推理、验证、回溯。
视觉原语与 System 2
视觉原语(visual-primitives)使 System 2 推理在视觉空间可行:
- 框原语:系统性地扫描、锚定、计数
- 点原语:逐步探索(DFS)、回溯、找到最优路径
这模拟了人类在 System 2 模式下的「用手指数、画辅助线」等空间认知策略。
相关概念
- chain-of-thought — System 2 在语言空间的表现
- visual-primitives — System 2 在视觉空间的扩展
- maze-navigation — System 2 空间推理的典型任务