20260617:目前有914 页
This commit is contained in:
77
reviews/ma-intragent-review-20260604.md
Normal file
77
reviews/ma-intragent-review-20260604.md
Normal file
@@ -0,0 +1,77 @@
|
||||
---
|
||||
title: "IntrAgent — Content-Grounded Literature Retrieval Review"
|
||||
type: review
|
||||
created: 2026-06-04
|
||||
arxiv: "2604.22861"
|
||||
paper: "ma-intragent-2026"
|
||||
---
|
||||
|
||||
# 📌 基本信息
|
||||
|
||||
- **论文**: IntrAgent: An LLM Agent for Content-Grounded Information Retrieval through Literature Review
|
||||
- **作者**: Fengbo Ma*, Zixin Rao*, Xiaoting Li, Zhetao Chen, Hongyue Sun, Yiping Zhao, Xianyan Chen†, Zhen Xiang† (University of Georgia)
|
||||
- **arXiv**: 2604.22861
|
||||
- **领域**: LLM Agent, Information Retrieval, Scientific Literature QA
|
||||
- **添加时间**: 2026-06-04
|
||||
- **代码**: https://github.com/FengboMa/IntrAgent
|
||||
- **数据集**: https://huggingface.co/datasets/IntrAgent/IntraBench
|
||||
|
||||
# 🎯 核心概念
|
||||
|
||||
1. **[[intraview|IntraView]]** — 内容锚定的科学文献信息检索任务:给定完整论文 + 查询 → 提取信息,严格限定于文献内容,信息缺失时明确承认
|
||||
2. **[[intragent|IntrAgent]]** — 首个解决 IntraView 的 LLM Agent,采用「心智仿生」设计,模拟人类阅读行为
|
||||
3. **[[section-ranking|Section Ranking]]** — 利用结构知识([[hierarchy-preservation|层级保持]])的推理驱动章节排序,替代 RAG 的语义相似度方法
|
||||
4. **[[iterative-reading|Iterative Reading]]** — 渐进式阅读:按序访问章节 → 提取细节 → [[sufficiency-check|充分性检查]] → 继续或终止
|
||||
5. **[[intrabench|IntraBench]]** — 315 实例 × 5 STEM 领域的首个 IntraView 基准,LLM 锚定多选题评估
|
||||
6. **[[content-grounded-retrieval]]** — 内容锚定作为忠实性的硬约束范式
|
||||
|
||||
# 🔗 概念网络
|
||||
|
||||
## 核心连接
|
||||
|
||||
```
|
||||
IntraView ──→ IntrAgent ──→ Section Ranking ──→ Hierarchy Preservation
|
||||
│ │
|
||||
└──→ Iterative Reading ──→ Sufficiency Check
|
||||
│
|
||||
└──→ Cross-Section Synthesis
|
||||
```
|
||||
|
||||
## 外部连接
|
||||
|
||||
- **→ [[rag|RAG]]**: 传统 baseline — 结构与语义的根本差异
|
||||
- **→ [[hallucination-mitigation]]**: 充分性检查作为显式幻觉闸门
|
||||
- **→ [[scientific-literature-qa]]**: IntraView 在科学文献 QA 谱系中的定位
|
||||
- **→ [[content-question-answering|CQA]]**: IntraView 所属的任务范式
|
||||
- **→ [[mineru]]**: PDF 预处理管道的核心工具
|
||||
- **→ [[agent-harness-engineering]]**: Agent 设计方法论视角
|
||||
|
||||
## 网络扩展
|
||||
|
||||
- 新增概念页: **15 个**(含 3 个占位: content-question-answering, faithfulness-in-ai, pdf-processing)
|
||||
- 连接已有概念: [[rag]], [[hallucination-mitigation]], [[agent-harness-engineering]], [[distractor-context]]
|
||||
|
||||
# 📚 Wiki 集成
|
||||
|
||||
- **新增页面**: 17 个(1 论文主页面 + 1 raw + 15 概念)
|
||||
- **链接完整性**: 100%(0 断链)
|
||||
- **总规模**: 591 → **603 页** (+2.0%)
|
||||
- **跨引用密度**: 核心概念平均 4.2 个外链
|
||||
|
||||
# 💡 关键洞察
|
||||
|
||||
### 1. 「结构」是科学文献检索中被低估的维度
|
||||
|
||||
RAG 把科学论文当作平面文本片段,忽略了章节层级蕴含的关键信息——"方法论"和"讨论"在语义相似度上可能接近,但它们对查询的意义完全不同。IntrAgent 的层级保持+推理排序解决了这个问题。这不是"更好 embedding"能解决的——需要结构感知推理。
|
||||
|
||||
### 2. 显式幻觉闸门 > 隐式可靠性
|
||||
|
||||
充分性检查是 IntrAgent 最优雅的设计。传统 RAG 的可靠性是隐式的——依赖检索质量+模型能力。而充分性检查在每个阅读步骤后显式问"够不够?不够就继续读"。这是一个简单但强大的范式:把质量控制的闸门前置,而不是事后验证。
|
||||
|
||||
### 3. 「心智仿生」是 Agent 设计的有效路径
|
||||
|
||||
IntrAgent 不是凭空设计新机制,而是系统地模仿人类阅读行为:先翻目录 → 挑相关章节 → 边读边判断 → 够了就停。这种 design-by-behavioral-analogy 在 Agent 设计中证明有效——13.2% 的跨领域提升不是来自更复杂的模型,而是来自更符合人类认知的流程。
|
||||
|
||||
---
|
||||
|
||||
*Review generated: 2026-06-04 | 小赫*
|
||||
Reference in New Issue
Block a user