20260601

2026-06-01 10:46:01 +08:00
parent 2faf4bb002
commit e96b955fda
221 changed files with 10219 additions and 332 deletions
--- a/concepts/kore-constraint.md
+++ b/concepts/kore-constraint.md
@@ -0,0 +1,56 @@
+---
+title: "KORE-CONSTRAINT（知识导向约束）"
+created: 2026-05-21
+type: concept
+tags: ["continual-learning", "null-space", "lora", "knowledge-retention"]
+sources: ["[[kore-knowledge-injection]]"]
+---
+
+# KORE-CONSTRAINT（知识导向约束）
+
+## 定义
+
+KORE-CONSTRAINT 是一种基于**零空间投影**的知识保留方法，通过在 LMM 线性层激活的协方差矩阵零空间中初始化 LoRA adapter，确保微调方向**最小化对已有知识的干扰**。
+
+## 核心机制
+
+### 1. 协方差矩阵存储知识
+收集 LMM 在代表预训练知识的随机样本上的激活 X ∈ R^{d_in × BL}，计算协方差矩阵：
+C = XX^T ∈ R^{d_in × d_in}
+
+C 有效捕获了多模态知识——相关任务（POPE 和 HallusionBench）在 C 中展示相似模式，而无关任务则不同。
+
+### 2. 零空间投影
+对 C 进行 SVD 分解 → 提取零空间（对应最小奇异值的向量）→ 构建投影矩阵 P = ÛÛ^T
+
+### 3. 初始化 LoRA Adapter
+将预训练权重 W₀ 投影到零空间：
+- SVD(W₀P) = U*, Σ*, (V*)^T
+- B = U*√Σ*,  A = √Σ*(V*)^T
+- 调整原始权重：W₀' = W₀ - BA（确保微调开始时模型不变）
+
+### 4. 冻结 A，仅微调 B
+A 被冻结在零空间内 → 更新项 BAC ≈ 0 → **无论 B 如何变化，旧知识不受影响**
+
+## 目标公式
+W*C = (W₀ + BA)C ≈ W₀C → BAC ≈ 0 → AC = 0（A 在 C 的零空间中）
+
+## 相比其他保留方法
+
+| 方法 | 机制 | 效果 |
+|------|------|------|
+| **KORE-CONSTRAINT** | 零空间投影 | 最有效 |
+| EWC | 重要参数正则化 | 几乎无效 |
+| LwF | 蒸馏旧输出 | 甚至加剧退化 |
+| MoELoRA | 专家隔离 | 次优 |
+| Replay | 混合旧数据训练 | 有效但需存储旧数据 |
+
+## 增量注入能力
+通过冻结 A 矩阵，KORE 支持**顺序注入多批新知识**而不会累积遗忘——每次新注入的 A 都在累积协方差矩阵的零空间中。
+
+## 参见
+
+- [[null-space-projection-knowledge|零空间投影知识保留]]
+- [[covariance-matrix-knowledge|协方差矩阵知识存储]]
+- [[kore-augmentation|KORE-AUGMENTATION]]
+- [[knowledge-retention|知识保留]]