Files
myWiki/concepts/world-model-lecun.md

64 lines
2.7 KiB
Markdown
Raw Blame History

This file contains ambiguous Unicode characters

This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.

---
title: "LeCun 世界模型理论"
created: 2026-06-08
updated: 2026-06-08
type: concept
tags: [world-model, LeCun, JEPA, planning, representation-learning]
sources: [raw/articles/lecun-llm-boundary-future-2026.md]
---
# LeCun 世界模型理论
> "从非常宽泛的层面来讲,世界模型是一种能让智能体系统预测自身行动后果的事物。" — Yann LeCun
与 [[internal-world-model|涌现式世界模型]]CTM等和生成式世界模型Dreamer/Sora不同LeCun 的世界模型理论强调在**抽象表征空间**中预测、服务于规划与决策。
## 核心定义
- 重心不在"生成",在"**预测后果**"
- 服务于规划与决策,而非重建观测
- 无法预测自身行动后果的系统 ≠ 真正意义上的 Agent
## 理论基础
### 水瓶类比
推无盖水瓶底部→滑动;推顶部→可能翻倒。但你**无法精确预测倒向何方**。
两层深层逻辑:
1. **不可约不确定性**:倒向取决于微观摩擦、空气扰动、液体湍流——认知上不可压缩的复杂性
2. **维度诅咒**256×256 RGB = 196,608维而语义表征仅~192维。像素空间极度稀疏、多模态、不连续。
**信息论视角**$H(pixel|context)$ 极高(不确定),$H(state|context)$ 低且结构化——后者才是可靠的预测着力点。
### 认知科学佐证
人类心智不做"像素级心理渲染"——你知道"瓶子会倒",但大脑不生成瓶身每个反光点的精确 RGB 值。JEPA 正是对这一生物直觉的模拟。
## 生成式 vs JEPA关键分叉
| 路线 | 训练目标 | 核心问题 |
|------|---------|---------|
| 生成式 (Dreamer/Sora/Genie) | 像素重建 | 浪费容量于噪声,因果混淆,规划无能 |
| JEPA (I-JEPA/V-JEPA/LeWorldModel) | 潜在空间预测 | 需防[[representation-collapse|表征坍缩]] |
**MAE 作为失败案例**LeCun 直接指出 FAIR 的掩码自编码器项目"结果非常令人失望"——像素重建不适用于世界模型。
## 与 [[objective-driven-ai|目标驱动AI]] 的关系
世界模型是目标驱动AI的"模拟引擎"
> 给定当前状态 + 候选动作 → 预测未来状态 → 成本模块评估 → 优化搜索最优动作序列
## 应用领域
1. **机器人技术**:动作条件世界模型用于规划
2. **工业过程控制**:喷气发动机、化工厂、发电厂——系统太复杂无法用方程建模,但可从数据训练
3. **医疗**:病人动态、人体细胞反应预测
4. **近期优先**AMI Labs 将工业控制作为短期优先方向
## 参考
- [[lecun-llm-boundary-future|LeCun 论 LLM 的边界与未来架构]]
- [[jepa|JEPA]]
- [[leworldmodel|LeWorldModel]]