20260625:很多新内容
This commit is contained in:
46
concepts/normal-tangent-decomposition.md
Normal file
46
concepts/normal-tangent-decomposition.md
Normal file
@@ -0,0 +1,46 @@
|
||||
---
|
||||
title: "Normal-Tangent Decomposition (法向-切向分解)"
|
||||
created: 2026-06-23
|
||||
updated: 2026-06-23
|
||||
type: concept
|
||||
tags: [gradient-descent, EoS, bifurcation, loss-landscape, overparameterization]
|
||||
sources: [gan-bifurcation-eos]
|
||||
---
|
||||
|
||||
# Normal-Tangent Decomposition (法向-切向分解)
|
||||
|
||||
法向-切向分解是 Gan (2026b) 分析过参数化网络 EoS 动力学的核心技术:将梯度下降迭代在 [[manifold-of-minimizers|极小值流形]] M 附近分解为法向和切向两个子空间的独立动力学。
|
||||
|
||||
## 分解框架
|
||||
|
||||
在 x* ∈ M 处,将梯度下降的两步映射 f(f(x)) 分别投影到:
|
||||
|
||||
**法向空间 N_x* M**:
|
||||
- 动力学经历 [[flip-bifurcation|flip 分岔]]
|
||||
- 投影后的两步映射存在稳定不动点 x_s(周期-2 轨道),条件为 [[first-lyapunov-coefficient|c₁ > 0]]
|
||||
- `Π_N (f(f(x_s)) - x*) = Π_N (x_s - x*)` 且 x_s 为法向投影动力学的稳定平衡点
|
||||
|
||||
**切向空间 T_x* M**:
|
||||
- 两步迭代沿 M 漂移,方向由 sharpness 梯度决定:
|
||||
```
|
||||
Π_T (f(f(x)) - x*) = -η p² Π_T ∇³L(x*)[v_max]² + O(η p³)
|
||||
```
|
||||
- 其中 p 为法向投影坐标,∇³L[v_max]² 是 sharpness 的梯度
|
||||
- 这意味着:**切向漂移始终指向 sharpness 递减方向**
|
||||
|
||||
## 收敛定理
|
||||
|
||||
在以下条件下 (Theorem 4.4),梯度下降从 x* 的邻域初始化且 η = 2/λ_max(x*) 时收敛到 M:
|
||||
1. c₁(x*) > 0(超临界分岔)
|
||||
2. Π_T ∇³L(x*)[v_max]² ≠ 0(保证切向漂移非退化——sharpness 严格下降)
|
||||
|
||||
## 直观理解
|
||||
|
||||
法向提供**稳定性**(周期振荡不发散),切向提供**收敛性**(漂移到更低 sharpness 区域)——两者协同使 EoS 训练成为可能。
|
||||
|
||||
## 参考
|
||||
|
||||
- [[gan-bifurcation-eos]](Theorem 4.4)
|
||||
- [[manifold-of-minimizers]]
|
||||
- [[flip-bifurcation]]
|
||||
- [[edge-of-stability]]
|
||||
Reference in New Issue
Block a user