Files
myWiki/concepts/content-grounded-retrieval.md

45 lines
1.8 KiB
Markdown
Raw Blame History

This file contains ambiguous Unicode characters

This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.

---
title: "Content-Grounded Retrieval — Faithfulness as First Principle"
type: concept
created: 2026-06-04
tags: [information-retrieval, faithfulness, hallucination-mitigation, grounding]
sources: ["ma-intragent-2026"]
---
# Content-Grounded Retrieval内容锚定检索
**定义**:一种信息检索范式,要求所有回答严格锚定于提供的文献内容,当信息不存在时明确承认而非编造。
## 核心原则
1. **忠实性优先**:准确性建立在内容忠实之上——错误的精确数字比诚实的"不知道"更有害
2. **显式边界**:当问题超出文献覆盖范围时,系统必须明确终止而非猜测
3. **可溯源**:每个提取的信息点应能追溯到原文献的具体位置
## 在 IntraView 中的体现
[[intraview|IntraView]] 任务将内容锚定作为硬约束,与现有任务的差异:
| 任务 | 信息源 | 内容锚定? |
|------|--------|-----------|
| 开放域 QA | 外部知识 | 否(可引入 LLM 知识) |
| RAG QA | 检索片段+模型知识 | 部分LLM 仍可补充) |
| **IntraView** | **仅提供文献** | **是(严格硬约束)** |
## 实现机制
[[intragent|IntrAgent]] 通过组合设计实现内容锚定:
- [[sufficiency-check|充分性检查]]:确保信息确实来自文献而非推测
- 细节锚定:每个细节关联到原文献的具体句子
- 缺失处理:通过"以上皆非"选项处理不可回答的查询
## 更广的意义
内容锚定检索不仅是 IntraView 的需求——它是可信 AI 系统的底层要求。在医疗、法律、科研决策场景中,"我不知道但文献说 X" 远比 "我认为是 Y" 更有价值。
## 相关概念
- [[hallucination-mitigation]] — 更广泛的幻觉控制
- [[faithfulness-in-ai]] — AI 忠实性
- [[intraview|IntraView]] — 内容锚定的具体任务实例