37 lines
1.4 KiB
Markdown
37 lines
1.4 KiB
Markdown
---
|
||
title: "Cache-Safe Forking(缓存安全分叉)"
|
||
created: 2026-05-11
|
||
updated: 2026-05-11
|
||
type: concept
|
||
tags: [agent-architecture, context-management, caching-optimization]
|
||
sources: [[prompt-caching-architecture]]
|
||
---
|
||
|
||
# Cache-Safe Forking(缓存安全分叉)
|
||
|
||
## 定义
|
||
|
||
Cache-Safe Forking 是一种在 [[context-compression|上下文压缩]] 过程中保持 [[prompt-caching|缓存]] 命中的技术,通过复用父会话的完整前缀避免压缩操作触发缓存失效。
|
||
|
||
## 算法
|
||
|
||
1. **复用父会话属性**:新请求对象包含与父会话完全相同的 System Prompt、Tools 定义、Session 配置
|
||
2. **强制拼接历史**:将父会话的完整 Message 历史直接拷贝到新请求
|
||
3. **追加总结指令**:在历史末尾追加 User Message:「基于上述历史,执行压缩总结」
|
||
|
||
## 效果
|
||
|
||
由于新请求的前缀(历史 + 系统指令)与父会话最后状态几乎完全重叠,API 层自动命中缓存,总结过程仅需计算最后追加的几百个 Token——将压缩成本降低一个数量级。
|
||
|
||
## 应用场景
|
||
|
||
- 长对话的自动总结
|
||
- [[meta-jctrader|Meta-JCTrader]] 中 AI Judge 的长期运行评估
|
||
- [[agentic-systems|Agent 系统]] 中无视上下文长度限制的持续推理
|
||
|
||
## 相关概念
|
||
|
||
- [[context-compression|上下文压缩]]
|
||
- [[prompt-caching|Prompt Caching]]
|
||
- [[agentic-systems|Agentic Systems]]
|