Files
myWiki/concepts/rag-closed-loop.md

1.6 KiB
Raw Blame History

title, created, updated, type, tags, sources
title created updated type tags sources
RAG 闭环迭代RAG Closed-Loop Iteration 2026-06-21 2026-06-21 concept
rag
content-ecology
spiral-of-silence
search
ACL 2024 (Spiral of Silence
How is LLM Killing IR?)

RAG 闭环迭代RAG Closed-Loop Iteration

指 AI 生成内容被搜索引擎索引后,又被后续 RAG 检索召回,形成AI 生成→全网索引→检索复用→再次生成的无限闭环。这是大模型沉默螺旋在信息检索场景的核心实证场景。

演化过程

轮次 0: 人类原创 50% + AI 生成 50%
轮次 1: AI 检索→生成(部分复用已有 AI 内容)
轮次 2: 新 AI 内容加入索引池
...
轮次 5: 人类原创 < 15%AI 同质化内容垄断

核心发现ACL 2024

  • 短期利好,长期崩塌:初期 AI 内容提升检索精度5 轮后质量下降
  • 搜索引擎偏爱 AI 内容:排序算法天然偏好更规整的 AI 生成文本
  • 数字沉默螺旋小众正确观点被边缘化AI 同质化甚至错误内容垄断信息场

与标准 RAG 的关系

标准 rag 关注单次检索增强的准确性RAG 闭环迭代关注多次迭代后的系统级涌现效应——单次 RAG 无害,但闭环累积后形成信息生态危机。

缓解方向

  • 检索排序中均衡 AI 内容与人类原创曝光的占比
  • 在索引层标记内容来源类型
  • 引入多样性奖励机制

参考