20260601
This commit is contained in:
44
concepts/distributed-prompt-caching.md
Normal file
44
concepts/distributed-prompt-caching.md
Normal file
@@ -0,0 +1,44 @@
|
||||
---
|
||||
title: "Distributed Prompt Caching (分布式提示词缓存)"
|
||||
created: 2026-05-29
|
||||
updated: 2026-05-29
|
||||
type: concept
|
||||
tags: ["distributed-systems", "prompt-caching", "LLM", "agent"]
|
||||
sources: ["https://mp.weixin.qq.com/s/MUWV7eug14bktUMlqsxfQw"]
|
||||
---
|
||||
|
||||
# Distributed Prompt Caching (分布式提示词缓存)
|
||||
|
||||
**Distributed Prompt Caching** 是将单机 [[prompt-caching]] 机制扩展到多机分布式集群的技术体系,解决跨物理节点的上下文缓存同步问题。在量化交易、多 Agent 协作等分布式场景中至关重要。
|
||||
|
||||
## 核心挑战
|
||||
|
||||
- **[[cache-cold-start|缓存冷启动]]**:新节点缺少已有会话的前缀哈希,导致全额 Token 重传和秒级重算
|
||||
- **跨服务商缓存割裂**:不同 LLM 供应商的缓存实现机制完全不同(Session ID vs Trie 树匹配)
|
||||
- **一致性风险**:多节点并发更新同一上下文时可能发生缓存"分叉"
|
||||
|
||||
## 解决架构
|
||||
|
||||
分布式 Prompt Caching 依赖三个核心组件:
|
||||
1. **[[global-context-hash-tree]]** — 基于 SHA-256 的会话唯一标识
|
||||
2. **[[distributed-cache-routing]]** — Redis 骨干网状态路由表
|
||||
3. **[[active-cache-warmup]]** — 预测性跨机预热
|
||||
|
||||
## 与单机 Prompt Caching 的对比
|
||||
|
||||
| 维度 | 单机 | 分布式 |
|
||||
|------|------|--------|
|
||||
| 缓存范围 | 单实例进程内 | 跨物理节点 + 跨服务商 |
|
||||
| 标识机制 | 前缀字节匹配 | SHA-256 复合键 |
|
||||
| 预热方式 | 被动(首次请求即缓存) | 主动(Shadow Calling) |
|
||||
| 一致性 | 无需处理 | 乐观锁 + 版本号 |
|
||||
|
||||
## 核心原则
|
||||
|
||||
> 用**空间的确定性**(高带宽内网 + Redis 路由)换取**时间的确定性**(消除秒级重算延迟)
|
||||
|
||||
## 相关
|
||||
|
||||
- [[distributed-agent-cache-sync-2026]] — 原始文章
|
||||
- [[prompt-caching]] — 单机 Prompt Caching
|
||||
- [[active-cache-warmup]] — 跨机预热机制
|
||||
Reference in New Issue
Block a user