Files
myWiki/concepts/covariance-matrix-knowledge.md
2026-06-01 10:46:01 +08:00

41 lines
1.6 KiB
Markdown
Raw Blame History

This file contains ambiguous Unicode characters

This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.

---
title: "协方差矩阵知识存储 (Covariance Matrix Knowledge Storage)"
created: 2026-05-21
type: concept
tags: ["linear-algebra", "knowledge-representation", "model-analysis"]
sources: ["[[kore-knowledge-injection]]"]
---
# 协方差矩阵知识存储
## 定义
协方差矩阵知识存储是指利用 LMM 线性层激活的**协方差矩阵**来捕获和存储模型已有的多模态知识。这一技术在 [[kore-constraint|KORE-CONSTRAINT]] 中被用于识别"哪些参数空间已被旧知识占据"。
## 构建方式
对 LMM 在代表预训练知识的样本上的激活 X ∈ R^{d_in × BL}
C = XX^T
使用 OneVision 数据集的 256 个样本General, Doc/Chart/Screen, Math/Reasoning, General OCR构建多维协方差矩阵。
## 为什么协方差矩阵能存储知识?
### 证据 1重构实验
对 C 进行 SVD → 移除最小 r 个奇异值对应的分量 → 重构权重。CO-SVD 比 Plain SVD 和 ASVD 更好地保留了性能,说明**多模态知识可以被协方差矩阵有效捕获**。
### 证据 2任务模式可视化
- 相关任务POPE 和 HallusionBench在协方差矩阵中展示**相似的异常值模式**
- 不相关任务MMBench展示**不同的模式**
- 说明协方差矩阵中的异常值分布**编码了任务特定的知识结构**
## 应用
在 KORE 中,协方差矩阵的零空间被用于初始化 LoRA adapter确保微调不会干扰已有知识。
## 参见
- [[null-space-projection-knowledge|零空间投影知识保留]]
- [[kore-constraint|KORE-CONSTRAINT]]
- [[covariance-matrix|协方差矩阵]]