SidneyZhang/myWiki

Files

Sidney Zhang 6021dea160

20260625:很多新内容

2026-06-25 14:08:47 +08:00

1.4 KiB

Raw Blame History

title, created, updated, type, tags, sources

title

created

updated

type

tags

sources

Leakage-Free State Prediction

2026-06-24

2026-06-24

concept

jepa

pretraining

world-model

information-leakage

Leakage-Free State Prediction

Leakage-Free State Prediction 是 VLA-JEPA 的核心设计原则：未来帧仅作为监督目标，永不作为模型输入。这是对当前 latent-action 预训练方法中信息泄漏问题的直接修复。

问题：信息泄漏

传统 latent-action 方法将当前观察和未来观察同时馈入同一模块，或允许未来上下文影响学习的 latent action。这创造了捷径：latent action 可以简单地编码未来本身，而非捕获状态转移。

VLA-JEPA 的方案

传统方法（有泄漏）：                 VLA-JEPA（无泄漏）：
  I_t + I_{t+1} → latent action      I_t → latent action
  （未来可影响编码）                   I_{t+1} → target（stop-grad）
                                     latent action → predict target

Target encoder 被冻结（stop-gradient），仅用于产生监督信号。Student 无法"看到"未来。

效果

Latent action 被迫编码真正的动态信息而非捷径
对相机运动和背景变化天然鲁棒
学到的表示更具语义抽象性

参考