Files
myWiki/concepts/kore-constraint.md
2026-06-01 10:46:01 +08:00

2.1 KiB
Raw Blame History

title, created, type, tags, sources
title created type tags sources
KORE-CONSTRAINT知识导向约束 2026-05-21 concept
continual-learning
null-space
lora
knowledge-retention
kore-knowledge-injection

KORE-CONSTRAINT知识导向约束

定义

KORE-CONSTRAINT 是一种基于零空间投影的知识保留方法,通过在 LMM 线性层激活的协方差矩阵零空间中初始化 LoRA adapter确保微调方向最小化对已有知识的干扰

核心机制

1. 协方差矩阵存储知识

收集 LMM 在代表预训练知识的随机样本上的激活 X ∈ R^{d_in × BL},计算协方差矩阵: C = XX^T ∈ R^{d_in × d_in}

C 有效捕获了多模态知识——相关任务POPE 和 HallusionBench在 C 中展示相似模式,而无关任务则不同。

2. 零空间投影

对 C 进行 SVD 分解 → 提取零空间(对应最小奇异值的向量)→ 构建投影矩阵 P = ÛÛ^T

3. 初始化 LoRA Adapter

将预训练权重 W₀ 投影到零空间:

  • SVD(W₀P) = U*, Σ*, (V*)^T
  • B = U*√Σ*, A = √Σ*(V*)^T
  • 调整原始权重W₀' = W₀ - BA确保微调开始时模型不变

4. 冻结 A仅微调 B

A 被冻结在零空间内 → 更新项 BAC ≈ 0 → 无论 B 如何变化,旧知识不受影响

目标公式

W*C = (W₀ + BA)C ≈ W₀C → BAC ≈ 0 → AC = 0A 在 C 的零空间中)

相比其他保留方法

方法 机制 效果
KORE-CONSTRAINT 零空间投影 最有效
EWC 重要参数正则化 几乎无效
LwF 蒸馏旧输出 甚至加剧退化
MoELoRA 专家隔离 次优
Replay 混合旧数据训练 有效但需存储旧数据

增量注入能力

通过冻结 A 矩阵KORE 支持顺序注入多批新知识而不会累积遗忘——每次新注入的 A 都在累积协方差矩阵的零空间中。

参见