69 lines
3.2 KiB
Markdown
69 lines
3.2 KiB
Markdown
---
|
||
title: "Review: Prompt Caching 架构工程手册"
|
||
created: 2026-05-11
|
||
type: review
|
||
sources: [[prompt-caching-architecture]]
|
||
---
|
||
|
||
# Review: Prompt Caching 架构工程手册
|
||
|
||
## 📌 基本信息
|
||
|
||
- **标题**:Agentic Systems: Prompt Caching 架构工程手册 (Volume I)
|
||
- **来源**:微信公众号
|
||
- **领域**:AI Agent 系统架构 / Prompt 工程 / 缓存优化
|
||
- **案例系统**:[[meta-jctrader|Meta-JCTrader]]
|
||
- **添加时间**:2026-05-11
|
||
- **类型**:工程实践教程
|
||
|
||
## 🎯 核心概念
|
||
|
||
1. **[[prompt-caching|Prompt Caching]]** — 基于前缀匹配的确定性计算优化,是 Agent 系统稳健性与推理确定性的架构基石
|
||
2. **[[prefix-matching|前缀匹配]]** — 字节级严格匹配机制,任何微小更改触发雪崩式失效
|
||
3. **[[prompt-layering|提示分层]]** — Global → Project → Session → Dynamic 四层架构,按变更频率分离静态与动态内容
|
||
4. **[[stub-pattern|Stub 模式]]** — 通过 ToolRegistry 统一接口避免工具定义变更导致的缓存污染
|
||
5. **[[cache-safe-forking|缓存安全分叉]]** — 复用父会话前缀实现低成本对话压缩
|
||
6. **[[cache-hit-ratio|CHR]]** — 核心监控指标,< 95% 即触发告警
|
||
7. **[[system-message-abuse|System Message 滥用]]** — 高频变更 System Message 的反模式及其工具化替代方案
|
||
8. **[[cache-health-observability|缓存可观测性]]** — 三大指标体系(CHR + 失效点识别 + 成本效率评分)
|
||
|
||
## 🔗 概念网络
|
||
|
||
**核心连接**:
|
||
```
|
||
prompt-caching ←→ prefix-matching ←→ cache-invalidation
|
||
↓ ↓
|
||
prompt-layering ←→ stub-pattern ←→ tool-registry
|
||
↓
|
||
cache-safe-forking ←→ context-compression
|
||
↓
|
||
cache-hit-ratio ←→ cache-health-observability
|
||
↓
|
||
meta-jctrader ←→ agentic-systems ←→ reinforcement-learning-trading
|
||
```
|
||
|
||
- **新增概念**:14 个(12 核心 + 2 占位符)
|
||
- **扩展网络**:连接了 16+ 个相关概念
|
||
- **占位符创建**:2 个([[agentic-systems]]、[[reinforcement-learning-trading]])
|
||
- **断链状态**:0 处断链,100% 链接完整
|
||
|
||
## 📚 Wiki 集成
|
||
|
||
| 指标 | 数值 |
|
||
|------|------|
|
||
| 新增页面 | 15 个(1 raw + 1 article + 12 概念 + 2 占位符 - 1 合并 = 15) |
|
||
| 总规模 | 195 → 203 页 |
|
||
| 链接完整性 | 100% 无断链 |
|
||
| 索引更新 | ✅ 全量重建 |
|
||
|
||
## 💡 关键洞察
|
||
|
||
1. **缓存不仅是性能问题,更是架构约束** — Prompt Caching 的确定性前缀匹配机制对系统设计提出了"静态前缀不可变性"的硬约束,这使得 Agent 架构必须从根本上区分"静态基础设施"与"动态业务逻辑"
|
||
|
||
2. **Stub 模式是缓存与灵活性的权衡最优解** — 通过 ToolRegistry 间接调用,在不牺牲缓存命中率的前提下保留了工具的动态扩展性,这是一种经典的计算机科学"中间层解耦"思路在 LLM 时代的映射
|
||
|
||
## 🏷️ 与现有知识库的关联
|
||
|
||
- 与 [[hyperagents|Hyperagents]] 的自我修改 Agent 形成互补:前者关注 Agent 内部的自我优化,本文关注 Agent 基础设施的效率优化
|
||
- 为 [[agentic-systems|Agentic Systems]] 概念提供了工程实现层面的具体方法论
|