This commit is contained in:
2026-06-01 10:46:01 +08:00
parent 2faf4bb002
commit e96b955fda
221 changed files with 10219 additions and 332 deletions

44
concepts/mme-voke.md Normal file
View File

@@ -0,0 +1,44 @@
---
title: "MMEVOKE"
created: 2026-05-21
type: concept
tags: ["benchmark", "multimodal", "knowledge-injection"]
sources: ["[[when-large-multimodal-models-confront-evolving-knowledge]]"]
---
# MMEVOKE
## 定义
MMEVOKE 是首个**多模态进化知识注入基准**,由 ICLR 2026 论文 "When Large Multimodal Models Confront Evolving Knowledge" 提出。
## 关键统计
| 指标 | 数值 |
|------|------|
| 总样本数 | 9,422 |
| 细粒度子领域 | 159News 29 + Entity 130 |
| 进化知识来源 | CNN新闻+ Wikipedia实体 |
| 图像数 | 18,834注入 9,422 + 评估 9,412 |
| News vs Entity | 47.7% vs 52.3% |
## 数据构建流程
1. **知识收集**:从 CNN robots.txt 提取 URLNews对比 Wikipedia 不同时间点版本识别新条目Entity
2. **内容总结**GPT-4o 对长文本摘要
3. **VQA 生成**GPT-4o 提取 VQA 对 + 核心对象 + 上位词Google 搜索 + CLIP 聚类清洗图像
4. **人工筛选**:每条约 10 秒人工审核,确保高质量
## 自进化特性
MMEVOKE 的构建流程最小化人工参与,仅人工筛选步骤未自动化。通过前端网页加速人工筛选,**每季度更新一次**。
## 领域分布
涵盖政治、商业、科技、体育、健康、娱乐等广泛领域,实体部分包含 130 个子领域。
## 参见
- [[evolving-knowledge-injection|进化知识注入]]
- [[self-evolving-benchmark|自进化基准]]
- [[when-large-multimodal-models-confront-evolving-knowledge|论文主页]]