SidneyZhang/myWiki

Fork 0

Files

Sidney Zhang 91fac5b6fc

20260617:目前有914 页

2026-06-17 15:02:40 +08:00

4.0 KiB

Raw Blame History

title, type, created, arxiv, paper

title	type	created	arxiv	paper
IntrAgent — Content-Grounded Literature Retrieval Review	review	2026-06-04	2604.22861	ma-intragent-2026

📌 基本信息

论文: IntrAgent: An LLM Agent for Content-Grounded Information Retrieval through Literature Review
作者: Fengbo Ma*, Zixin Rao*, Xiaoting Li, Zhetao Chen, Hongyue Sun, Yiping Zhao, Xianyan Chen†, Zhen Xiang† (University of Georgia)
arXiv: 2604.22861
领域: LLM Agent, Information Retrieval, Scientific Literature QA
添加时间: 2026-06-04
代码: https://github.com/FengboMa/IntrAgent
数据集: https://huggingface.co/datasets/IntrAgent/IntraBench

🎯 核心概念

intraview — 内容锚定的科学文献信息检索任务：给定完整论文 + 查询 → 提取信息，严格限定于文献内容，信息缺失时明确承认
intragent — 首个解决 IntraView 的 LLM Agent，采用「心智仿生」设计，模拟人类阅读行为
section-ranking — 利用结构知识（hierarchy-preservation）的推理驱动章节排序，替代 RAG 的语义相似度方法
iterative-reading — 渐进式阅读：按序访问章节 → 提取细节 → sufficiency-check → 继续或终止
intrabench — 315 实例 × 5 STEM 领域的首个 IntraView 基准，LLM 锚定多选题评估
content-grounded-retrieval — 内容锚定作为忠实性的硬约束范式

🔗 概念网络

核心连接

IntraView ──→ IntrAgent ──→ Section Ranking ──→ Hierarchy Preservation
                │                                      │
                └──→ Iterative Reading ──→ Sufficiency Check
                           │
                           └──→ Cross-Section Synthesis

外部连接

→ rag: 传统 baseline — 结构与语义的根本差异
→ hallucination-mitigation: 充分性检查作为显式幻觉闸门
→ scientific-literature-qa: IntraView 在科学文献 QA 谱系中的定位
→ content-question-answering: IntraView 所属的任务范式
→ mineru: PDF 预处理管道的核心工具
→ agent-harness-engineering: Agent 设计方法论视角

网络扩展

新增概念页: 15 个（含 3 个占位: content-question-answering, faithfulness-in-ai, pdf-processing）
连接已有概念: rag, hallucination-mitigation, agent-harness-engineering, distractor-context

📚 Wiki 集成

新增页面: 17 个（1 论文主页面 + 1 raw + 15 概念）
链接完整性: 100%（0 断链）
总规模: 591 → 603 页 (+2.0%)
跨引用密度: 核心概念平均 4.2 个外链

💡 关键洞察

1. 「结构」是科学文献检索中被低估的维度

RAG 把科学论文当作平面文本片段，忽略了章节层级蕴含的关键信息——"方法论"和"讨论"在语义相似度上可能接近，但它们对查询的意义完全不同。IntrAgent 的层级保持+推理排序解决了这个问题。这不是"更好 embedding"能解决的——需要结构感知推理。

2. 显式幻觉闸门 > 隐式可靠性

充分性检查是 IntrAgent 最优雅的设计。传统 RAG 的可靠性是隐式的——依赖检索质量+模型能力。而充分性检查在每个阅读步骤后显式问"够不够？不够就继续读"。这是一个简单但强大的范式：把质量控制的闸门前置，而不是事后验证。

3. 「心智仿生」是 Agent 设计的有效路径

IntrAgent 不是凭空设计新机制，而是系统地模仿人类阅读行为：先翻目录 → 挑相关章节 → 边读边判断 → 够了就停。这种 design-by-behavioral-analogy 在 Agent 设计中证明有效——13.2% 的跨领域提升不是来自更复杂的模型，而是来自更符合人类认知的流程。

Review generated: 2026-06-04 | 小赫

4.0 KiB Raw Blame History Unescape Escape