Files
myWiki/concepts/knowledge-retention.md
2026-06-01 10:46:01 +08:00

1.5 KiB
Raw Blame History

title, created, type, tags, sources
title created type tags sources
知识保留 (Knowledge Retention) 2026-05-21 concept
continual-learning
catastrophic-forgetting
when-large-multimodal-models-confront-evolving-knowledge

知识保留 (Knowledge Retention)

定义

知识保留是evolving-knowledge-injection中的关键目标之一,指在注入新知识后保持模型已有通用能力不退化

方法谱系

有效方法

  • data-replay:直接排练——混合旧数据训练,排名第 1LoRA和第 3Full-FT
  • moe-lora:结构隔离——为新知识划出专用参数区,排名第 2

无效方法

  • EWCElastic Weight Consolidation通过正则化约束重要参数不变——排名第 5几乎无缓解
  • LwFLearning without Forgetting通过知识蒸馏保留旧模型输出——排名第 6甚至加剧退化

核心洞察

直接排练 > 结构隔离 > 间接约束

EWC 和 LwF 的失败说明:试图通过"冻结"参数来保留能力的策略在多模态进化知识注入场景下基本无效——新知识与旧知识的交互远复杂于简单的参数权重保护。

与知识增强的协同

一个意外发现是knowledge-aware-augmentation本身也能部分缓解能力退化,这暗示了主动学习能力保留之间存在协同效应。

参见