43 lines
1.4 KiB
Markdown
43 lines
1.4 KiB
Markdown
---
|
||
title: "Agentic RAG"
|
||
created: 2026-06-24
|
||
updated: 2026-06-24
|
||
type: concept
|
||
tags: ["rag", "agent", "retrieval", "planning"]
|
||
sources:
|
||
- "[[financial-llm-practice-2026]]"
|
||
---
|
||
|
||
# Agentic RAG
|
||
|
||
Agentic RAG 是将 Agent 规划能力引入检索增强生成(RAG)的架构范式。与传统 RAG 的"一次检索→一次生成"不同,Agentic RAG 赋予模型**动态规划检索策略、自我评估信息充分性**的能力。
|
||
|
||
## 核心工作流
|
||
|
||
1. **任务拆解**:将复杂查询拆分为子问题序列
|
||
2. **工具选择**:根据子问题类型动态选择检索工具(PageIndex / BM25 / 向量检索)
|
||
3. **迭代检索**:执行检索,评估当前信息是否足够回答
|
||
4. **自我评估**:不足则规划下一轮检索,足够则汇总生成
|
||
|
||
## 金融场景实践
|
||
|
||
恒生电子在金融长文档检索中采用 PageIndex + Agentic RAG 组合:
|
||
|
||
- PageIndex 负责粗粒度定位(章节级)
|
||
- Agentic RAG 负责调度多工具、判断是否需要跨章节检索
|
||
- 单 chunk 召回准确率超过 95%
|
||
|
||
## 与传统 RAG 的区别
|
||
|
||
| 维度 | 传统 RAG | Agentic RAG |
|
||
|------|---------|------------|
|
||
| 检索次数 | 1 次 | 多轮迭代 |
|
||
| 工具选择 | 固定 | 动态选择 |
|
||
| 自我评估 | 无 | 有 |
|
||
| 适用场景 | 简单事实查询 | 复杂推理问题 |
|
||
|
||
## 参考
|
||
- [[financial-llm-practice-2026|金融行业大模型落地实践]]
|
||
- [[pageindex]]
|
||
- [[context-engineering]]
|