Files
myWiki/papers/kore-knowledge-injection.md
2026-06-01 10:46:01 +08:00

3.9 KiB
Raw Blame History

title, authors, date, arxiv, venue, type, tags
title authors date arxiv venue type tags
KORE: Knowledge-Oriented Controls for Knowledge Injection
Kailin Jiang
Hongbo Jiang
Ning Jiang
Zhi Gao
Jinhe Bi
Yuchen Ren
Bin Li
Yuntao Du
Lei Liu
Qing Li
2026 2510.19316 ICML 2026 paper
multimodal
knowledge-injection
continual-learning
lora
null-space

KORE: Enhancing Knowledge Injection via Knowledge-Oriented Controls

ICML 2026 | arxiv | kore-lmm.github.io

核心问题

LMM 的知识是静态的,无法跟上现实世界发展。有效的evolving-knowledge-injection需要同时满足两个目标:knowledge-adaptation(注入新知识)和 knowledge-retention(保持旧能力)。现有方法在两者之间难以平衡——要么泛化差,要么灾难性遗忘。

KORE 是 MMEVOKE 系列工作的解决方案论文(同一作者团队),提出了基于知识导向控制的协同方法。

核心方法

1. KORE-AUGMENTATION知识导向增强

kore-augmentation 将单个知识项自动转化为结构化的知识树74K 训练数据):

  • 主干Trunk:多轮对话数据 —— 启发式 Q&A + GPT-4o 生成的最多 10 轮对话
  • 分支Branches:指令任务数据 —— 视觉识别、图像描述、VQA46,468 样本)

这与knowledge-aware-augmentationknowledge-agnostic-augmentation有本质区别:不仅是表面变换,而是构建了一个连贯的知识结构,实现了从"数据记忆"到"知识内化"的跨越。

2. KORE-CONSTRAINT知识导向约束

kore-constraint 的核心思想是在零空间中微调,不干扰已有知识

  1. 从 LMM 线性层的激活中计算covariance-matrix-knowledge C = XX^T存储先前知识
  2. 对 C 进行 SVD 分解,提取其零空间(对应最小奇异值的向量)
  3. 将预训练权重 W₀ 投影到零空间中初始化 LoRA adapter
  4. 冻结 A 矩阵在零空间内,仅微调 B

这确保了更新项 BAC ≈ 0 —— 无论 B 如何变化,都不会干扰已存储的旧知识。

3. HARS 评估指标

harsHarmonized Adaptation-Retention Score将知识适应和知识保留统一为一个调和指标类似 F1 平衡 Precision 和 Recall。

实验结果LLaVA-v1.5 7B

方法 K.A (CEM↑) K.R (Avg↑) HARS↑
Vanilla 4.89 46.74
Full-FT 18.02 16.09 16.60
LoRA 15.23 41.38 16.77
Replay 14.58 44.18 17.29
MoELoRA 16.22 31.55 20.17
O-LoRA 14.50 44.52 17.39
KORE 30.65 51.75 35.96

KORE 在知识适应上翻倍于最佳 baseline30.65 vs 18.02),且在知识保留上超越 Vanilla51.75 vs 46.74),实现了真正的正向保留

关键洞察

  1. 结构化 > 离散化:构建知识树比生成孤立变体更有效
  2. 零空间 > 正则化:在零空间中微调比 EWC/LwF 的间接约束更精确
  3. 增量能力:通过冻结 A 矩阵KORE 支持顺序注入多批知识而不遗忘
  4. 通用性:在 LLaVA-v1.5 (7B/13B) 和 Qwen2.5-VL (7B) 上均验证有效

概念链接