20260617:目前有914 页
This commit is contained in:
48
concepts/abstract-representation-space.md
Normal file
48
concepts/abstract-representation-space.md
Normal file
@@ -0,0 +1,48 @@
|
||||
---
|
||||
title: "抽象表征空间 (Abstract Representation Space)"
|
||||
created: 2026-06-08
|
||||
updated: 2026-06-08
|
||||
type: concept
|
||||
tags: [representation-learning, JEPA, LeCun, world-model, information-theory]
|
||||
sources: [raw/articles/lecun-llm-boundary-future-2026.md]
|
||||
---
|
||||
|
||||
# 抽象表征空间 (Abstract Representation Space)
|
||||
|
||||
[[jepa|JEPA]] 架构中执行预测和规划的核心空间。区别于像素空间、token 空间,是对世界状态的语义级压缩表征。
|
||||
|
||||
## 为什么必须在抽象空间?
|
||||
|
||||
### 信息论论证
|
||||
|
||||
- 像素空间:$H(pixel|context)$ 极高——即便给定充分上下文,像素取值仍高度不确定
|
||||
- 语义空间:$H(state|context)$ 相对低且结构化——提供可靠预测的稳定着力点
|
||||
|
||||
### 维度对比
|
||||
|
||||
- 256×256 RGB 像素:**196,608 维**
|
||||
- LeWorldModel 潜在表示:**192 维**(~1000× 压缩)
|
||||
|
||||
在抽象空间做预测,模型算力集中于因果结构,而非纹理、光照、阴影、水面折射等对决策无用的细节。
|
||||
|
||||
### 与 token 空间的区别
|
||||
|
||||
| 维度 | Token 空间 | 抽象表征空间 |
|
||||
|------|-----------|------------|
|
||||
| 搜索方式 | 离散符号枚举 | 连续向量优化 |
|
||||
| 物理世界适用性 | ❌ 行动空间连续高维不可枚举 | ✅ 不依赖离散符号可枚举性 |
|
||||
| 规划性质 | "哪段话听起来合理" | "走这条路会到哪里" |
|
||||
|
||||
## LeCun 的表述
|
||||
|
||||
> "我在 JEPA 中谈的是,你不是在词元空间里做这件事,而是在抽象思维空间里做。"
|
||||
|
||||
## 认知科学对应
|
||||
|
||||
人类在想象"推水瓶"时,直觉物理工作在抽象的、去噪的、以物体为中心的表征层——你知道"瓶子会倒",但大脑不生成瓶身每个反光点的精确 RGB 值。JEPA 正是对这一生物直觉的工程模拟。
|
||||
|
||||
## 来源
|
||||
|
||||
- [[lecun-llm-boundary-future|原始文章]]
|
||||
- [[jepa|JEPA]]
|
||||
- [[world-model-lecun|LeCun 世界模型]]
|
||||
Reference in New Issue
Block a user