LeCun 世界模型理论

"从非常宽泛的层面来讲，世界模型是一种能让智能体系统预测自身行动后果的事物。" — Yann LeCun

与 internal-world-model（CTM等）和生成式世界模型（Dreamer/Sora）不同，LeCun 的世界模型理论强调在抽象表征空间中预测、服务于规划与决策。

核心定义

推无盖水瓶底部→滑动；推顶部→可能翻倒。但你无法精确预测倒向何方。

两层深层逻辑：

信息论视角：H(pixel|context) 极高（不确定），H(state|context) 低且结构化——后者才是可靠的预测着力点。

人类心智不做"像素级心理渲染"——你知道"瓶子会倒"，但大脑不生成瓶身每个反光点的精确 RGB 值。JEPA 正是对这一生物直觉的模拟。

路线	训练目标	核心问题
生成式 (Dreamer/Sora/Genie)	像素重建	浪费容量于噪声，因果混淆，规划无能
JEPA (I-JEPA/V-JEPA/LeWorldModel)	潜在空间预测	需防[[representation-collapse

MAE 作为失败案例：LeCun 直接指出 FAIR 的掩码自编码器项目"结果非常令人失望"——像素重建不适用于世界模型。

世界模型是目标驱动AI的"模拟引擎"：

给定当前状态 + 候选动作 → 预测未来状态 → 成本模块评估 → 优化搜索最优动作序列