Files
myWiki/concepts/kore-constraint.md
2026-06-01 10:46:01 +08:00

57 lines
2.1 KiB
Markdown
Raw Blame History

This file contains ambiguous Unicode characters

This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.

---
title: "KORE-CONSTRAINT知识导向约束"
created: 2026-05-21
type: concept
tags: ["continual-learning", "null-space", "lora", "knowledge-retention"]
sources: ["[[kore-knowledge-injection]]"]
---
# KORE-CONSTRAINT知识导向约束
## 定义
KORE-CONSTRAINT 是一种基于**零空间投影**的知识保留方法,通过在 LMM 线性层激活的协方差矩阵零空间中初始化 LoRA adapter确保微调方向**最小化对已有知识的干扰**。
## 核心机制
### 1. 协方差矩阵存储知识
收集 LMM 在代表预训练知识的随机样本上的激活 X ∈ R^{d_in × BL},计算协方差矩阵:
C = XX^T ∈ R^{d_in × d_in}
C 有效捕获了多模态知识——相关任务POPE 和 HallusionBench在 C 中展示相似模式,而无关任务则不同。
### 2. 零空间投影
对 C 进行 SVD 分解 → 提取零空间(对应最小奇异值的向量)→ 构建投影矩阵 P = ÛÛ^T
### 3. 初始化 LoRA Adapter
将预训练权重 W₀ 投影到零空间:
- SVD(W₀P) = U*, Σ*, (V*)^T
- B = U*√Σ*, A = √Σ*(V*)^T
- 调整原始权重W₀' = W₀ - BA确保微调开始时模型不变
### 4. 冻结 A仅微调 B
A 被冻结在零空间内 → 更新项 BAC ≈ 0 → **无论 B 如何变化,旧知识不受影响**
## 目标公式
W*C = (W₀ + BA)C ≈ W₀C → BAC ≈ 0 → AC = 0A 在 C 的零空间中)
## 相比其他保留方法
| 方法 | 机制 | 效果 |
|------|------|------|
| **KORE-CONSTRAINT** | 零空间投影 | 最有效 |
| EWC | 重要参数正则化 | 几乎无效 |
| LwF | 蒸馏旧输出 | 甚至加剧退化 |
| MoELoRA | 专家隔离 | 次优 |
| Replay | 混合旧数据训练 | 有效但需存储旧数据 |
## 增量注入能力
通过冻结 A 矩阵KORE 支持**顺序注入多批新知识**而不会累积遗忘——每次新注入的 A 都在累积协方差矩阵的零空间中。
## 参见
- [[null-space-projection-knowledge|零空间投影知识保留]]
- [[covariance-matrix-knowledge|协方差矩阵知识存储]]
- [[kore-augmentation|KORE-AUGMENTATION]]
- [[knowledge-retention|知识保留]]