20260601
This commit is contained in:
77
papers/kore-knowledge-injection.md
Normal file
77
papers/kore-knowledge-injection.md
Normal file
@@ -0,0 +1,77 @@
|
||||
---
|
||||
title: "KORE: Knowledge-Oriented Controls for Knowledge Injection"
|
||||
authors: ["Kailin Jiang", "Hongbo Jiang", "Ning Jiang", "Zhi Gao", "Jinhe Bi", "Yuchen Ren", "Bin Li", "Yuntao Du", "Lei Liu", "Qing Li"]
|
||||
date: 2026
|
||||
arxiv: "2510.19316"
|
||||
venue: "ICML 2026"
|
||||
type: paper
|
||||
tags: ["multimodal", "knowledge-injection", "continual-learning", "lora", "null-space"]
|
||||
---
|
||||
|
||||
# KORE: Enhancing Knowledge Injection via Knowledge-Oriented Controls
|
||||
|
||||
> ICML 2026 | [[arxiv|https://arxiv.org/abs/2510.19316]] | [kore-lmm.github.io](https://kore-lmm.github.io/)
|
||||
|
||||
## 核心问题
|
||||
|
||||
LMM 的知识是**静态的**,无法跟上现实世界发展。有效的[[evolving-knowledge-injection|知识注入]]需要同时满足两个目标:[[knowledge-adaptation|知识适应]](注入新知识)和 [[knowledge-retention|知识保留]](保持旧能力)。现有方法在两者之间难以平衡——要么泛化差,要么灾难性遗忘。
|
||||
|
||||
KORE 是 MMEVOKE 系列工作的**解决方案论文**(同一作者团队),提出了基于**知识导向控制**的协同方法。
|
||||
|
||||
## 核心方法
|
||||
|
||||
### 1. KORE-AUGMENTATION:知识导向增强
|
||||
|
||||
[[kore-augmentation|KORE-AUGMENTATION]] 将单个知识项自动转化为**结构化的知识树**(74K 训练数据):
|
||||
|
||||
- **主干(Trunk)**:多轮对话数据 —— 启发式 Q&A + GPT-4o 生成的最多 10 轮对话
|
||||
- **分支(Branches)**:指令任务数据 —— 视觉识别、图像描述、VQA(46,468 样本)
|
||||
|
||||
这与[[knowledge-aware-augmentation|知识感知增强]]和[[knowledge-agnostic-augmentation|知识无关增强]]有本质区别:不仅是表面变换,而是构建了一个**连贯的知识结构**,实现了从"数据记忆"到"**知识内化**"的跨越。
|
||||
|
||||
### 2. KORE-CONSTRAINT:知识导向约束
|
||||
|
||||
[[kore-constraint|KORE-CONSTRAINT]] 的核心思想是**在零空间中微调,不干扰已有知识**:
|
||||
|
||||
1. 从 LMM 线性层的激活中计算[[covariance-matrix-knowledge|协方差矩阵]] C = XX^T,存储先前知识
|
||||
2. 对 C 进行 SVD 分解,提取其**零空间**(对应最小奇异值的向量)
|
||||
3. 将预训练权重 W₀ 投影到零空间中初始化 LoRA adapter
|
||||
4. 冻结 A 矩阵在零空间内,仅微调 B
|
||||
|
||||
这确保了更新项 BAC ≈ 0 —— 无论 B 如何变化,都不会干扰已存储的旧知识。
|
||||
|
||||
### 3. HARS 评估指标
|
||||
|
||||
[[hars|HARS]](Harmonized Adaptation-Retention Score)将知识适应和知识保留统一为一个调和指标,类似 F1 平衡 Precision 和 Recall。
|
||||
|
||||
## 实验结果(LLaVA-v1.5 7B)
|
||||
|
||||
| 方法 | K.A (CEM↑) | K.R (Avg↑) | HARS↑ |
|
||||
|------|-----------|-----------|-------|
|
||||
| Vanilla | 4.89 | 46.74 | — |
|
||||
| Full-FT | 18.02 | 16.09 | 16.60 |
|
||||
| LoRA | 15.23 | 41.38 | 16.77 |
|
||||
| Replay | 14.58 | 44.18 | 17.29 |
|
||||
| MoELoRA | 16.22 | 31.55 | 20.17 |
|
||||
| O-LoRA | 14.50 | 44.52 | 17.39 |
|
||||
| **KORE** | **30.65** | **51.75** | **35.96** |
|
||||
|
||||
KORE 在知识适应上**翻倍**于最佳 baseline(30.65 vs 18.02),且在知识保留上**超越** Vanilla(51.75 vs 46.74),实现了真正的**正向保留**。
|
||||
|
||||
## 关键洞察
|
||||
|
||||
1. **结构化 > 离散化**:构建知识树比生成孤立变体更有效
|
||||
2. **零空间 > 正则化**:在零空间中微调比 EWC/LwF 的间接约束更精确
|
||||
3. **增量能力**:通过冻结 A 矩阵,KORE 支持顺序注入多批知识而不遗忘
|
||||
4. **通用性**:在 LLaVA-v1.5 (7B/13B) 和 Qwen2.5-VL (7B) 上均验证有效
|
||||
|
||||
## 概念链接
|
||||
|
||||
- [[kore-augmentation]] — 知识导向增强:树干+树枝的知识树构建
|
||||
- [[kore-constraint]] — 知识导向约束:零空间投影微调
|
||||
- [[knowledge-tree]] — 知识树:结构化知识表示
|
||||
- [[null-space-projection-knowledge]] — 零空间投影知识保留
|
||||
- [[covariance-matrix-knowledge]] — 协方差矩阵存储知识
|
||||
- [[hars]] — 调和适应保留评分
|
||||
- [[evolving-knowledge-injection]] — 进化知识注入(前置工作)
|
||||
- [[mme-voke]] — MMEVOKE 基准(使用 EVOKE 评估)
|
||||
Reference in New Issue
Block a user