20260429:一些新东西

This commit is contained in:
2026-04-29 16:28:13 +08:00
parent 0b1535dfaf
commit 56c4d3ef7c
70 changed files with 2798 additions and 3 deletions

15
concepts/duo-attention.md Normal file
View File

@@ -0,0 +1,15 @@
# DuoAttention
**双模式注意力**,区分检索头 (Retrieval Heads) 和流式头 (Streaming Heads)。
## 核心区分
- **检索头**: 需要完整上下文的注意力头 → 全注意力
- **流式头**: 只需局部模式的注意力头 → 滚动 KV 缓存
## 相关概念
- [[attention-sinks]] — 注意力汇
- [[kv-cache-bottleneck]] — 缓存优化
- [[mixture-of-attention-schemes]] — MoAS 路由方案
- [[llm-attention-survey-2026]] — 综述参考