Files
myWiki/concepts/world-model-lecun.md

2.7 KiB
Raw Blame History

title, created, updated, type, tags, sources
title created updated type tags sources
LeCun 世界模型理论 2026-06-08 2026-06-08 concept
world-model
LeCun
JEPA
planning
representation-learning
raw/articles/lecun-llm-boundary-future-2026.md

LeCun 世界模型理论

"从非常宽泛的层面来讲,世界模型是一种能让智能体系统预测自身行动后果的事物。" — Yann LeCun

internal-world-modelCTM等和生成式世界模型Dreamer/Sora不同LeCun 的世界模型理论强调在抽象表征空间中预测、服务于规划与决策。

核心定义

  • 重心不在"生成",在"预测后果"
  • 服务于规划与决策,而非重建观测
  • 无法预测自身行动后果的系统 ≠ 真正意义上的 Agent

理论基础

水瓶类比

推无盖水瓶底部→滑动;推顶部→可能翻倒。但你无法精确预测倒向何方

两层深层逻辑:

  1. 不可约不确定性:倒向取决于微观摩擦、空气扰动、液体湍流——认知上不可压缩的复杂性
  2. 维度诅咒256×256 RGB = 196,608维而语义表征仅~192维。像素空间极度稀疏、多模态、不连续。

信息论视角H(pixel|context) 极高(不确定),H(state|context) 低且结构化——后者才是可靠的预测着力点。

认知科学佐证

人类心智不做"像素级心理渲染"——你知道"瓶子会倒",但大脑不生成瓶身每个反光点的精确 RGB 值。JEPA 正是对这一生物直觉的模拟。

生成式 vs JEPA关键分叉

路线 训练目标 核心问题
生成式 (Dreamer/Sora/Genie) 像素重建 浪费容量于噪声,因果混淆,规划无能
JEPA (I-JEPA/V-JEPA/LeWorldModel) 潜在空间预测 需防[[representation-collapse

MAE 作为失败案例LeCun 直接指出 FAIR 的掩码自编码器项目"结果非常令人失望"——像素重建不适用于世界模型。

objective-driven-ai 的关系

世界模型是目标驱动AI的"模拟引擎"

给定当前状态 + 候选动作 → 预测未来状态 → 成本模块评估 → 优化搜索最优动作序列

应用领域

  1. 机器人技术:动作条件世界模型用于规划
  2. 工业过程控制:喷气发动机、化工厂、发电厂——系统太复杂无法用方程建模,但可从数据训练
  3. 医疗:病人动态、人体细胞反应预测
  4. 近期优先AMI Labs 将工业控制作为短期优先方向

参考