Files
myWiki/concepts/cache-safe-forking.md

1.4 KiB
Raw Permalink Blame History

title, created, updated, type, tags, sources
title created updated type tags sources
Cache-Safe Forking缓存安全分叉 2026-05-11 2026-05-11 concept
agent-architecture
context-management
caching-optimization
prompt-caching-architecture

Cache-Safe Forking缓存安全分叉

定义

Cache-Safe Forking 是一种在 context-compression 过程中保持 prompt-caching 命中的技术,通过复用父会话的完整前缀避免压缩操作触发缓存失效。

算法

  1. 复用父会话属性:新请求对象包含与父会话完全相同的 System Prompt、Tools 定义、Session 配置
  2. 强制拼接历史:将父会话的完整 Message 历史直接拷贝到新请求
  3. 追加总结指令:在历史末尾追加 User Message「基于上述历史执行压缩总结」

效果

由于新请求的前缀(历史 + 系统指令与父会话最后状态几乎完全重叠API 层自动命中缓存,总结过程仅需计算最后追加的几百个 Token——将压缩成本降低一个数量级。

应用场景

相关概念