SidneyZhang/myWiki

Files

Sidney Zhang e96b955fda

20260601

2026-06-01 10:46:01 +08:00

1.5 KiB

Raw Blame History

title, created, type, tags, sources

title

created

type

tags

sources

知识保留 (Knowledge Retention)

2026-05-21

concept

continual-learning

catastrophic-forgetting

when-large-multimodal-models-confront-evolving-knowledge

知识保留 (Knowledge Retention)

定义

知识保留是evolving-knowledge-injection中的关键目标之一，指在注入新知识后保持模型已有通用能力不退化。

方法谱系

有效方法

data-replay：直接排练——混合旧数据训练，排名第 1（LoRA）和第 3（Full-FT）
moe-lora：结构隔离——为新知识划出专用参数区，排名第 2

无效方法

EWC（Elastic Weight Consolidation）：通过正则化约束重要参数不变——排名第 5，几乎无缓解
LwF（Learning without Forgetting）：通过知识蒸馏保留旧模型输出——排名第 6，甚至加剧退化

核心洞察

直接排练 > 结构隔离 > 间接约束

EWC 和 LwF 的失败说明：试图通过"冻结"参数来保留能力的策略在多模态进化知识注入场景下基本无效——新知识与旧知识的交互远复杂于简单的参数权重保护。

与知识增强的协同

一个意外发现是knowledge-aware-augmentation本身也能部分缓解能力退化，这暗示了主动学习与能力保留之间存在协同效应。

参见