61 lines
2.2 KiB
Markdown
61 lines
2.2 KiB
Markdown
---
|
||
title: "Iterative Reading — Progressive Information Extraction from Literature"
|
||
type: concept
|
||
created: 2026-06-04
|
||
tags: [information-extraction, iterative-process, llm-agent, scientific-literature]
|
||
sources: ["ma-intragent-2026"]
|
||
---
|
||
|
||
# Iterative Reading(迭代阅读)
|
||
|
||
**定义**:[[intragent|IntrAgent]] 第二阶段的机制——按章节排序结果逐步阅读文献,提取关键细节,直至信息充分。
|
||
|
||
## 动作循环
|
||
|
||
每一步,Agent 从预定义的三个动作中选择:
|
||
|
||
### 1. 重排序章节访问(Reordered Section Access)
|
||
- 从 [[section-ranking|章节排序]] 输出列表 C_R 中获取下一个章节
|
||
- 确保按估计相关性降序阅读
|
||
- 保持专注且高效的阅读轨迹
|
||
|
||
### 2. 章节细节提取(Section Detail Extraction)
|
||
- 从当前章节提取与查询相关的关键科学细节 Dᵢ
|
||
- 包括:术语、数值数据、实验设置、测量结果、统计指标、比较/因果陈述
|
||
- 每个细节锚定到原始句子并存入短期记忆
|
||
- 供最终答案合成使用
|
||
|
||
### 3. 信息充分性检查(Information Sufficiency Check)
|
||
- 这是抑制 [[hallucination-mitigation|幻觉]] 的核心机制
|
||
- LLM 评估已积累的所有细节 {D₁, ..., Dₘ} 是否足以回答问题 Q
|
||
- 不足 → 继续读下一节("NO")
|
||
- 充分 → 终止循环("YES")
|
||
|
||
## 三种置信度模式
|
||
|
||
| 模式 | 行为 | 开销 |
|
||
|------|------|------|
|
||
| 保守型 | 读少量章节即终止 | 低 |
|
||
| 平衡型(默认) | 中等章节数 | 中 |
|
||
| 激进型 | 读取更多章节 | 高 |
|
||
|
||
## 最终答案合成
|
||
|
||
循环终止后(读 m 个章节),LLM 综合所有累积细节生成最终答案:
|
||
```
|
||
A = LLM(D₁, ..., Dₘ, Q)
|
||
```
|
||
|
||
## 关键设计洞察
|
||
|
||
- **防止过早终止**:相关证据可能分散在多个非相邻章节——充分性检查跨节累积证据
|
||
- **显式幻觉控制**:与 RAG 的隐式可靠性不同,充分性检查是显式的质量闸门
|
||
- **自适应开销**:置信度模式在准确性与计算成本间提供可控权衡
|
||
|
||
## 相关概念
|
||
|
||
- [[section-ranking]] — 迭代阅读依赖的章节排序
|
||
- [[sufficiency-check]] — 充分性检查机制
|
||
- [[cross-section-synthesis]] — 跨节信息综合
|
||
- [[hallucination-mitigation]] — 幻觉抑制
|