20260625:很多新内容

This commit is contained in:
2026-06-25 14:08:47 +08:00
parent 91fac5b6fc
commit 6021dea160
375 changed files with 19263 additions and 251 deletions

View File

@@ -0,0 +1,50 @@
---
title: "张量收缩对偶 (Tensor Contraction Duality)"
created: 2026-06-18
updated: 2026-06-18
type: concept
tags: [mathematics, duality, ssm, attention]
sources:
- dao-transformers-are-ssms-2024
---
# 张量收缩对偶 (Tensor Contraction Duality)
张量收缩对偶是 Dao & Gu (2024) 揭示 [[structured-state-space-duality|SSD]] 框架的**两种互补视角之一**——从双线性形式的张量收缩导出 SSM ↔ Attention 的对偶。
## 两种视角
### 视角 1矩阵变换
```
Y = M · X
M_ij = C_i^T A_{i-1} ... A_{j+1} B_j
```
- 将 SSM 看作参数化矩阵 M 的乘法
- M 属于 [[semiseparable-matrices|半可分矩阵]] 家族
### 视角 2张量收缩
```
序列变换 = 张量收缩(Z, X)
```
- 将 SSM 和 Attention 统一为张量上的相同收缩模式
- Z 的秩和结构决定了是线性SSM还是二次Attention形式
## 对偶的本质
两种视角等价但揭示不同属性:
| 视角 | 揭示 | 适合 |
|------|------|------|
| 矩阵变换 | 结构化矩阵、分块算法 | 高效实现SSD 算法) |
| 张量收缩 | 对偶性、注意力连接 | 理论分析、框架统一 |
## 在证明中的应用
张量收缩视角提供了线性注意力的**新证明**——从张量收缩的双线性形式直接导出其循环形式,比 Katharopoulos et al. (2020) 的原始证明更简洁。
## 参考
- [[structured-state-space-duality|SSD]]
- [[semiseparable-matrices|半可分矩阵]]
- [[structured-masked-attention|SMA]]
- [[dao-transformers-are-ssms-2024|论文]]