Files
myWiki/concepts/mineru.md

1.4 KiB
Raw Blame History

title, type, created, tags, sources
title type created tags sources
minerU — PDF-to-Markdown for Scientific Literature concept 2026-06-04
pdf-parsing
document-processing
tool
open-source
ma-intragent-2026

minerU

定义minerU 是一个用于科学文献 PDF 解析的开源视觉模型,能够将 PDF 文档转换为结构化 Markdown 格式,同时保留章节层级、表格、公式和图片信息。

在 IntrAgent 中的角色

intragent 使用 minerU 作为 PDF 预处理管道的第一步:

  1. 将输入文献 PDF 转换为 Markdown C'
  2. 统一添加 ### 标记
  3. 为后续的 section-rankingiterative-reading 提供结构化输入

能力

  • 布局检测:识别章节标题、段落、表格、图片区域
  • 章节识别:自动提取章节层级结构
  • 公式处理:保留 LaTeX 数学公式
  • 表格提取:结构化表格数据

重要性

在科学文献处理管道中PDF → 结构化文本的转换质量直接决定了后续推理的准确率。minerU 的视觉模型方法比传统的规则式 PDF 解析(如 pdftotext能更好地保留文档结构。

相关概念