20260625:很多新内容
This commit is contained in:
66
concepts/agentic-cache-manager.md
Normal file
66
concepts/agentic-cache-manager.md
Normal file
@@ -0,0 +1,66 @@
|
||||
---
|
||||
title: "Agentic Cache Manager"
|
||||
created: 2026-06-20
|
||||
updated: 2026-06-20
|
||||
type: concept
|
||||
tags: ["kv-cache", "memory", "drift", "streaming", "inference"]
|
||||
sources: ["https://arxiv.org/abs/2606.17800"]
|
||||
---
|
||||
|
||||
# Agentic Cache Manager (Agentic 缓存管理)
|
||||
|
||||
**Agentic Cache Manager** 是 [[maineCoon|MaineCoon]] [[agentic-streaming-inference|流式推理框架]] 中管理模型记忆的控制器:在单个持久 [[kv-cache|KV-Cache]] 上同时治理**记住多少**(bounded keep-set)和**记多准确**(drift control)。
|
||||
|
||||
## 单持久缓存 → 连续流
|
||||
|
||||
传统方案的问题:
|
||||
- **重生成增长前缀**:每块 cost 随长度增长 → 不可扩展
|
||||
- **拼接独立段**:周期 re-anchoring → 身份/颜色/音频跳变
|
||||
|
||||
MaineCoon 使用**一个永不清理的 KV-cache**,chunk 间连续性由 attention 原生携带,无拼接边界。
|
||||
|
||||
## Bounded Keep-Set(有界保留集)
|
||||
|
||||
缓存不能无限增长——模型使用有限 RoPE 位置编码。Manager 每次 commit 后重新计算保留集:
|
||||
|
||||
```
|
||||
Keep = Subject Anchor ∪ Scene Sink ∪ Scene Anchors ∪ Recent Chunks ∪ Restored
|
||||
```
|
||||
|
||||
- **Subject Anchor**:主体语义参考块(见 drift control)
|
||||
- **Scene Sink**:场景建立时的 persistent attention sink
|
||||
- **Scene Anchors**:散布的场景关键帧
|
||||
- **Recent Chunks**:固定预算的最新 chunk
|
||||
- **Restored**:场景返回时恢复的历史 chunk
|
||||
|
||||
**四种 attention 类型各自独立追踪**:visual self-attn, audio self-attn, cross-modal AV paths 的缓存增长速率不同,需要 per-type ledger 独立管理。
|
||||
|
||||
## Drift Control(漂移控制)
|
||||
|
||||
核心原则:**永不修改已发布的像素**——修正仅施加于写回缓存的 committed copy。
|
||||
|
||||
### Statistical Anchor (AdaStat)
|
||||
写回缓存前对 clean latent 做 per-channel 统计匹配:
|
||||
```
|
||||
AdaStat(x) = σ* ⊙ (x - μ(x))/σ(x) + μ*
|
||||
```
|
||||
- 参考 (μ*, σ*) 从场景开头初始化,慢 EMA 更新
|
||||
- 仅对**低漂移 chunk** 更新参考,追踪合法 scene evolution
|
||||
- 音频通道使用降低的强度
|
||||
|
||||
### Subject Anchor(主体锚)
|
||||
- 开放词汇分割器在周期性快照上对规划器的文本描述评分
|
||||
- 从流的 clean latent 中收割最高分 token
|
||||
- 作为 KV-cache 中的固定参考块,**永不输出**
|
||||
- 使漂移从不可逆变为**可恢复**
|
||||
|
||||
## Bounded Positions
|
||||
位置编码通过 bounded epoch slots 保持在训练范围内。epoch 耗尽时用保留的 clean latent 在新 slots 重建缓存,保留内容但刷新位置编码。
|
||||
|
||||
## 效果
|
||||
在二十秒训练片段上训练的模型,可连续流式运行 **45 分钟无显著退化**。
|
||||
|
||||
## 参考
|
||||
- [[maineCoon|MaineCoon 论文]] Section 4.2
|
||||
- [[kv-cache]]
|
||||
- [[agentic-streaming-inference|Agentic Streaming Inference]]
|
||||
Reference in New Issue
Block a user