20260625:很多新内容
This commit is contained in:
42
concepts/agentic-rag.md
Normal file
42
concepts/agentic-rag.md
Normal file
@@ -0,0 +1,42 @@
|
||||
---
|
||||
title: "Agentic RAG"
|
||||
created: 2026-06-24
|
||||
updated: 2026-06-24
|
||||
type: concept
|
||||
tags: ["rag", "agent", "retrieval", "planning"]
|
||||
sources:
|
||||
- "[[financial-llm-practice-2026]]"
|
||||
---
|
||||
|
||||
# Agentic RAG
|
||||
|
||||
Agentic RAG 是将 Agent 规划能力引入检索增强生成(RAG)的架构范式。与传统 RAG 的"一次检索→一次生成"不同,Agentic RAG 赋予模型**动态规划检索策略、自我评估信息充分性**的能力。
|
||||
|
||||
## 核心工作流
|
||||
|
||||
1. **任务拆解**:将复杂查询拆分为子问题序列
|
||||
2. **工具选择**:根据子问题类型动态选择检索工具(PageIndex / BM25 / 向量检索)
|
||||
3. **迭代检索**:执行检索,评估当前信息是否足够回答
|
||||
4. **自我评估**:不足则规划下一轮检索,足够则汇总生成
|
||||
|
||||
## 金融场景实践
|
||||
|
||||
恒生电子在金融长文档检索中采用 PageIndex + Agentic RAG 组合:
|
||||
|
||||
- PageIndex 负责粗粒度定位(章节级)
|
||||
- Agentic RAG 负责调度多工具、判断是否需要跨章节检索
|
||||
- 单 chunk 召回准确率超过 95%
|
||||
|
||||
## 与传统 RAG 的区别
|
||||
|
||||
| 维度 | 传统 RAG | Agentic RAG |
|
||||
|------|---------|------------|
|
||||
| 检索次数 | 1 次 | 多轮迭代 |
|
||||
| 工具选择 | 固定 | 动态选择 |
|
||||
| 自我评估 | 无 | 有 |
|
||||
| 适用场景 | 简单事实查询 | 复杂推理问题 |
|
||||
|
||||
## 参考
|
||||
- [[financial-llm-practice-2026|金融行业大模型落地实践]]
|
||||
- [[pageindex]]
|
||||
- [[context-engineering]]
|
||||
Reference in New Issue
Block a user