Files
myWiki/concepts/mme-voke.md
2026-06-01 10:46:01 +08:00

45 lines
1.5 KiB
Markdown
Raw Blame History

This file contains ambiguous Unicode characters

This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.

---
title: "MMEVOKE"
created: 2026-05-21
type: concept
tags: ["benchmark", "multimodal", "knowledge-injection"]
sources: ["[[when-large-multimodal-models-confront-evolving-knowledge]]"]
---
# MMEVOKE
## 定义
MMEVOKE 是首个**多模态进化知识注入基准**,由 ICLR 2026 论文 "When Large Multimodal Models Confront Evolving Knowledge" 提出。
## 关键统计
| 指标 | 数值 |
|------|------|
| 总样本数 | 9,422 |
| 细粒度子领域 | 159News 29 + Entity 130 |
| 进化知识来源 | CNN新闻+ Wikipedia实体 |
| 图像数 | 18,834注入 9,422 + 评估 9,412 |
| News vs Entity | 47.7% vs 52.3% |
## 数据构建流程
1. **知识收集**:从 CNN robots.txt 提取 URLNews对比 Wikipedia 不同时间点版本识别新条目Entity
2. **内容总结**GPT-4o 对长文本摘要
3. **VQA 生成**GPT-4o 提取 VQA 对 + 核心对象 + 上位词Google 搜索 + CLIP 聚类清洗图像
4. **人工筛选**:每条约 10 秒人工审核,确保高质量
## 自进化特性
MMEVOKE 的构建流程最小化人工参与,仅人工筛选步骤未自动化。通过前端网页加速人工筛选,**每季度更新一次**。
## 领域分布
涵盖政治、商业、科技、体育、健康、娱乐等广泛领域,实体部分包含 130 个子领域。
## 参见
- [[evolving-knowledge-injection|进化知识注入]]
- [[self-evolving-benchmark|自进化基准]]
- [[when-large-multimodal-models-confront-evolving-knowledge|论文主页]]