20260617:目前有914 页

This commit is contained in:
2026-06-17 15:02:40 +08:00
parent e96b955fda
commit 91fac5b6fc
423 changed files with 20687 additions and 34 deletions

53
concepts/vicreg.md Normal file
View File

@@ -0,0 +1,53 @@
---
title: "VICReg (Variance-Invariance-Covariance Regularization)"
created: 2026-06-08
updated: 2026-06-08
type: concept
tags: [regularization, self-supervised-learning, JEPA, representation-learning]
sources: [raw/articles/lecun-llm-boundary-future-2026.md]
---
# VICReg (Variance-Invariance-Covariance Regularization)
**方差-不变性-协方差正则化**,端到端 JEPA 模型(如 PLDM采用的防[[representation-collapse|表征坍缩]]方案。不依赖负样本,直接在表征的统计特性上施加约束。
## 三项损失
$$\mathcal{L}_{VICReg} = \underbrace{\lambda \mathcal{L}_{inv}}_{\text{不变性}} + \underbrace{\mu \mathcal{L}_{var}}_{\text{方差}} + \underbrace{\nu \mathcal{L}_{cov}}_{\text{协方差}}$$
### 1. 不变性 (Invariance)
$$\mathcal{L}_{inv} = \frac{1}{n} \sum_{i=1}^{n} \|s_i - s'_i\|^2$$
同一输入的不同增强/视角,编码器输出应相似。保证表征对无关变换(光照、裁剪、视角)具有鲁棒性。
### 2. 方差 (Variance)
$$\mathcal{L}_{var} = \frac{1}{d} \sum_{j=1}^{d} \max(0, \gamma - \sqrt{\text{Var}(s_j) + \epsilon})$$
逐维度计算标准差,强制大于阈值 $\gamma$。**防止所有样本挤在同一数值上**——强迫编码器利用每一个维度携带信息。
### 3. 协方差 (Covariance)
$$\mathcal{L}_{cov} = \sum_{j \neq k} C(S)^2_{jk}$$
批次表征协方差矩阵的非对角元素平方和。**防止维度之间"串供"**——所有信息压缩在2-3个维度其他维度冗余。强迫各维度独立携带不同信息提高有效容量。
## 效果与局限
✅ 效果:成功对抗表征坍塌,被 PLDM 等模型采用
❌ 局限:
- 扩展到世界模型时需组合多个损失项超参数数量增加PLDM 需 6 个可调超参)
- 各项损失之间互相拉扯,训练不稳定
## 演进VICReg → [[sigreg|SIGReg]]
VICReg 已有成熟工作但超参数过多。SIGReg 在其基础上精化:将三项启发式约束统一为**一个数学上更干净的分布匹配问题**——强制嵌入分布匹配各向同性高斯分布。LeWorldModel 用 SIGReg 将超参数从 6 个压缩到 1 个 $\lambda$。
## 来源
- [[lecun-llm-boundary-future|原始文章]]
- [[sigreg|SIGReg]]
- [[representation-collapse|表征坍缩]]
- [[jepa|JEPA]]