--- title: "Internal World Model" created: 2026-05-15 updated: 2026-05-15 type: concept tags: [cognitive-science, planning, representation, world-models] sources: [raw/papers/darlow-ctm-2025.md] --- # Internal World Model **内部世界模型** 是 agent 在内部构建的环境表征,用于预测、规划和推理而不直接与环境交互。 ## 经典定义 (Ha & Schmidhuber, 2018) 世界模型由三个组件构成: 1. **Vision (V)**:将观察压缩为潜在编码 2. **Memory (M)**:预测未来的潜在编码 3. **Controller (C)**:基于潜在编码选择动作 ## CTM 中的涌现世界模型 在 2D 迷宫任务中,CTM **没有位置编码**,但必须输出从起点到终点的动作序列。这意味着: - CTM 必须在内部构建空间表征("地图") - 表征通过 [[neural-synchronization|神经同步]] 自然形成 - 无需显式设计——从架构中涌现 ### 证据 - CTM 训练于 39×39 迷宫,可泛化到 99×99(通过重复应用学到的策略) - 模型可以在训练步数之外"继续探索" - 注意力可视化显示模型有序追踪路径 ## 与显式世界模型的对比 | 维度 | 显式世界模型 (Dreamer 等) | CTM 涌现世界模型 | |------|-------------------------|-----------------| | 设计方式 | 明确分离 V/M/C 模块 | 同一架构中的涌现属性 | | 表示形式 | 潜在向量快照 | 神经同步矩阵(时序) | | 空间编码 | 通常使用位置编码 | 无位置编码,完全自建 | ## 来源 - [[darlow-ctm-2025|CTM 论文]] - Ha & Schmidhuber, "World Models", 2018