Files
myWiki/concepts/covariance-matrix-knowledge.md
2026-06-01 10:46:01 +08:00

1.6 KiB
Raw Blame History

title, created, type, tags, sources
title created type tags sources
协方差矩阵知识存储 (Covariance Matrix Knowledge Storage) 2026-05-21 concept
linear-algebra
knowledge-representation
model-analysis
kore-knowledge-injection

协方差矩阵知识存储

定义

协方差矩阵知识存储是指利用 LMM 线性层激活的协方差矩阵来捕获和存储模型已有的多模态知识。这一技术在 kore-constraint 中被用于识别"哪些参数空间已被旧知识占据"。

构建方式

对 LMM 在代表预训练知识的样本上的激活 X ∈ R^{d_in × BL} C = XX^T

使用 OneVision 数据集的 256 个样本General, Doc/Chart/Screen, Math/Reasoning, General OCR构建多维协方差矩阵。

为什么协方差矩阵能存储知识?

证据 1重构实验

对 C 进行 SVD → 移除最小 r 个奇异值对应的分量 → 重构权重。CO-SVD 比 Plain SVD 和 ASVD 更好地保留了性能,说明多模态知识可以被协方差矩阵有效捕获

证据 2任务模式可视化

  • 相关任务POPE 和 HallusionBench在协方差矩阵中展示相似的异常值模式
  • 不相关任务MMBench展示不同的模式
  • 说明协方差矩阵中的异常值分布编码了任务特定的知识结构

应用

在 KORE 中,协方差矩阵的零空间被用于初始化 LoRA adapter确保微调不会干扰已有知识。

参见