Files
myWiki/concepts/knowledge-aware-augmentation.md
2026-06-01 10:46:01 +08:00

1.7 KiB
Raw Blame History

title, created, type, tags, sources
title created type tags sources
知识感知增强 (Knowledge-Aware Augmentation) 2026-05-21 concept
data-augmentation
knowledge-injection
multimodal
when-large-multimodal-models-confront-evolving-knowledge

知识感知增强 (Knowledge-Aware Augmentation)

定义

知识感知增强是一种知识驱动的语义级数据增强策略,通过对知识的深层理解进行创造性改写和补充,而非机械的表面变换。

与数据增强的核心区别

| 维度 | knowledge-agnostic-augmentation | 知识感知增强 | |------|------------|------------| | 驱动方式 | 规则驱动 | 知识驱动 | | 文本增强 | 同义词替换 | 基于理解的创造性改写 | | 图像增强 | 旋转/裁剪/颜色变换 | 引入真实世界多角度图像 | | 语义增益 | 无 | 丰富概念感知 | | 效果 | 负面-5.66% CEM | 正面+11.32% CEM |

效果

在 MMEVOKE 基准上,仅使用单个数据实例的知识感知增强:

  • 文本增强:+11.32% CEM+39.82% F1
  • 视觉增强:+43.28% CEM+13.19% F1
  • 性能随数据量增加进一步提升

意外发现

知识感知增强不仅能提升知识适应,还能部分缓解能力退化——在 MMBench、SEEDBench2 Plus、ScienceQA 上超过标准 Full-FT 和 LoRA甚至超过专门的保留技术EWC、LwF

本质

体现了"数据记忆"与"知识内化"的根本区别——前者仅能拟合训练数据,后者却能提取和操控事实知识。

参见