myWiki/concepts/world-model-lecun.md

---
title: "LeCun 世界模型理论"
created: 2026-06-08
updated: 2026-06-08
type: concept
tags: [world-model, LeCun, JEPA, planning, representation-learning]
sources: [raw/articles/lecun-llm-boundary-future-2026.md]
---

# LeCun 世界模型理论

> "从非常宽泛的层面来讲，世界模型是一种能让智能体系统预测自身行动后果的事物。" — Yann LeCun

与 [[internal-world-model|涌现式世界模型]]（CTM等）和生成式世界模型（Dreamer/Sora）不同，LeCun 的世界模型理论强调在**抽象表征空间**中预测、服务于规划与决策。

## 核心定义

- 重心不在"生成"，在"**预测后果**"
- 服务于规划与决策，而非重建观测
- 无法预测自身行动后果的系统 ≠ 真正意义上的 Agent

## 理论基础

### 水瓶类比

推无盖水瓶底部→滑动；推顶部→可能翻倒。但你**无法精确预测倒向何方**。

两层深层逻辑：
1. **不可约不确定性**：倒向取决于微观摩擦、空气扰动、液体湍流——认知上不可压缩的复杂性
2. **维度诅咒**：256×256 RGB = 196,608维，而语义表征仅~192维。像素空间极度稀疏、多模态、不连续。

**信息论视角**：$H(pixel|context)$ 极高（不确定），$H(state|context)$ 低且结构化——后者才是可靠的预测着力点。

### 认知科学佐证

人类心智不做"像素级心理渲染"——你知道"瓶子会倒"，但大脑不生成瓶身每个反光点的精确 RGB 值。JEPA 正是对这一生物直觉的模拟。

## 生成式 vs JEPA：关键分叉

| 路线 | 训练目标 | 核心问题 |
|------|---------|---------|
| 生成式 (Dreamer/Sora/Genie) | 像素重建 | 浪费容量于噪声，因果混淆，规划无能 |
| JEPA (I-JEPA/V-JEPA/LeWorldModel) | 潜在空间预测 | 需防[[representation-collapse|表征坍缩]] |

**MAE 作为失败案例**：LeCun 直接指出 FAIR 的掩码自编码器项目"结果非常令人失望"——像素重建不适用于世界模型。

## 与 [[objective-driven-ai|目标驱动AI]] 的关系

世界模型是目标驱动AI的"模拟引擎"：
> 给定当前状态 + 候选动作 → 预测未来状态 → 成本模块评估 → 优化搜索最优动作序列

## 应用领域

1. **机器人技术**：动作条件世界模型用于规划
2. **工业过程控制**：喷气发动机、化工厂、发电厂——系统太复杂无法用方程建模，但可从数据训练
3. **医疗**：病人动态、人体细胞反应预测
4. **近期优先**：AMI Labs 将工业控制作为短期优先方向

## 参考

- [[lecun-llm-boundary-future|LeCun 论 LLM 的边界与未来架构]]
- [[jepa|JEPA]]
- [[leworldmodel|LeWorldModel]]