2.0 KiB
2.0 KiB
title, created, updated, type, tags, sources
| title | created | updated | type | tags | sources |
|---|---|---|---|---|---|
| RAG 系统 | 2025-04-15 | 2026-05-01 | concept |
RAG 系统
类型: AI 应用架构
领域: 大语言模型应用,知识管理
全称: Retrieval-Augmented Generation(检索增强生成)
定义
RAG(Retrieval-Augmented Generation,检索增强生成)是一种将信息检索与生成式 AI 相结合的架构模式。它通过在生成过程中检索外部知识库来增强大语言模型的输出质量和准确性。
核心组成
1. 检索器(Retriever)
- 从知识库或文档集中检索相关信息
- 通常基于向量搜索或关键词匹配
- 输出与查询相关的文档片段
2. 生成器(Generator)
- 通常是大语言模型(如 GPT、Claude 等)
- 根据检索到的上下文生成回答
- 结合检索信息与模型内部知识
3. 知识库(Knowledge Base)
- 存储结构化或半结构化的文档数据
- 支持高效检索的索引结构
- 可持续更新和扩展
工作流程
用户查询
↓
查询处理/向量化
↓
知识库检索 → 相关文档片段
↓
上下文组装(查询 + 文档)
↓
LLM 生成回答
↓
输出结果
优势
- 减少幻觉: 基于检索到的实际数据生成回答,降低凤凌反复
- 知识更新: 无需重新训练模型,只需更新知识库
- 可解释性: 可以展示生成回答所依据的来源文档
- 领域适应: 适合专业领域、时效性要求高的场景
应用场景
- 企业知识管理: 基于公司文档的智能问答
- 客服系统: 结合产品文档的自动回复
- 学术研究: 基于论文数据库的研究辅助
- 法律咨询: 基于法规和案例的智能咨询
相关概念
- crawl4ai — 用于 RAG 数据准备的网页抓取工具
- knowledge-bank — AI 辅助开发时代的知识管理系统
- llm-applications — 大型语言模型应用
创建时间: 2026-04-22
最后更新: 2026-04-22