Files
myWiki/concepts/null-space-projection-knowledge.md
2026-06-01 10:46:01 +08:00

1.4 KiB
Raw Blame History

title, created, type, tags, sources
title created type tags sources
零空间投影知识保留 (Null Space Projection for Knowledge Retention) 2026-05-21 concept
null-space
continual-learning
linear-algebra
kore-knowledge-injection

零空间投影知识保留

定义

零空间投影知识保留是 kore-constraint 的核心技术,通过将微调方向限制在已有知识协方差矩阵的零空间中,实现新知识注入与旧知识保留的完美解耦。

数学原理

给定预训练权重 W₀ 和激活协方差矩阵 C = XX^T

目标W*C ≈ W₀C旧知识的输出保持稳定

→ (W₀ + BA)C ≈ W₀C → BAC ≈ 0 → AC = 0

解决方案:将 A 矩阵限制在 C 的零空间中:

  1. SVD(C) → 提取零空间的基向量 Û
  2. P = ÛÛ^T零空间投影矩阵
  3. W₀P 作为微调的起点

优势

  • 精确性:数学上保证 BAC = 0而非启发式近似
  • 可组合性:支持多批知识的顺序注入
  • 参数效率:与 LoRA 无缝集成,增量参数极少

直观理解

协方差矩阵 C 的列空间是已有知识占据的"空间"。零空间是与之正交的"未使用空间"。在零空间中微调意味着:新知识被写入模型的"空白区域",不会覆盖已有知识。

参见