1.4 KiB
1.4 KiB
title, type, created, tags, sources
| title | type | created | tags | sources | |||||
|---|---|---|---|---|---|---|---|---|---|
| minerU — PDF-to-Markdown for Scientific Literature | concept | 2026-06-04 |
|
|
minerU
定义:minerU 是一个用于科学文献 PDF 解析的开源视觉模型,能够将 PDF 文档转换为结构化 Markdown 格式,同时保留章节层级、表格、公式和图片信息。
在 IntrAgent 中的角色
intragent 使用 minerU 作为 PDF 预处理管道的第一步:
- 将输入文献 PDF 转换为 Markdown
C' - 统一添加
#和##标记 - 为后续的 section-ranking 和 iterative-reading 提供结构化输入
能力
- 布局检测:识别章节标题、段落、表格、图片区域
- 章节识别:自动提取章节层级结构
- 公式处理:保留 LaTeX 数学公式
- 表格提取:结构化表格数据
重要性
在科学文献处理管道中,PDF → 结构化文本的转换质量直接决定了后续推理的准确率。minerU 的视觉模型方法比传统的规则式 PDF 解析(如 pdftotext)能更好地保留文档结构。
相关概念
- section-ranking — 使用 minerU 输出的章节标题
- hierarchy-preservation — 使用 minerU 输出的层级信息
- pdf-processing — 更广泛的 PDF 处理工具和方法