Files
myWiki/concepts/internal-world-model.md

46 lines
1.5 KiB
Markdown
Raw Blame History

This file contains ambiguous Unicode characters

This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.

---
title: "Internal World Model"
created: 2026-05-15
updated: 2026-05-15
type: concept
tags: [cognitive-science, planning, representation, world-models]
sources: [raw/papers/darlow-ctm-2025.md]
---
# Internal World Model
**内部世界模型** 是 agent 在内部构建的环境表征,用于预测、规划和推理而不直接与环境交互。
## 经典定义 (Ha & Schmidhuber, 2018)
世界模型由三个组件构成:
1. **Vision (V)**:将观察压缩为潜在编码
2. **Memory (M)**:预测未来的潜在编码
3. **Controller (C)**:基于潜在编码选择动作
## CTM 中的涌现世界模型
在 2D 迷宫任务中CTM **没有位置编码**,但必须输出从起点到终点的动作序列。这意味着:
- CTM 必须在内部构建空间表征("地图"
- 表征通过 [[neural-synchronization|神经同步]] 自然形成
- 无需显式设计——从架构中涌现
### 证据
- CTM 训练于 39×39 迷宫,可泛化到 99×99通过重复应用学到的策略
- 模型可以在训练步数之外"继续探索"
- 注意力可视化显示模型有序追踪路径
## 与显式世界模型的对比
| 维度 | 显式世界模型 (Dreamer 等) | CTM 涌现世界模型 |
|------|-------------------------|-----------------|
| 设计方式 | 明确分离 V/M/C 模块 | 同一架构中的涌现属性 |
| 表示形式 | 潜在向量快照 | 神经同步矩阵(时序) |
| 空间编码 | 通常使用位置编码 | 无位置编码,完全自建 |
## 来源
- [[darlow-ctm-2025|CTM 论文]]
- Ha & Schmidhuber, "World Models", 2018