20260625:很多新内容

This commit is contained in:
2026-06-25 14:08:47 +08:00
parent 91fac5b6fc
commit 6021dea160
375 changed files with 19263 additions and 251 deletions

View File

@@ -0,0 +1,46 @@
---
title: "Normal-Tangent Decomposition (法向-切向分解)"
created: 2026-06-23
updated: 2026-06-23
type: concept
tags: [gradient-descent, EoS, bifurcation, loss-landscape, overparameterization]
sources: [gan-bifurcation-eos]
---
# Normal-Tangent Decomposition (法向-切向分解)
法向-切向分解是 Gan (2026b) 分析过参数化网络 EoS 动力学的核心技术:将梯度下降迭代在 [[manifold-of-minimizers|极小值流形]] M 附近分解为法向和切向两个子空间的独立动力学。
## 分解框架
在 x* ∈ M 处,将梯度下降的两步映射 f(f(x)) 分别投影到:
**法向空间 N_x* M**
- 动力学经历 [[flip-bifurcation|flip 分岔]]
- 投影后的两步映射存在稳定不动点 x_s周期-2 轨道),条件为 [[first-lyapunov-coefficient|c₁ > 0]]
- `Π_N (f(f(x_s)) - x*) = Π_N (x_s - x*)` 且 x_s 为法向投影动力学的稳定平衡点
**切向空间 T_x* M**
- 两步迭代沿 M 漂移,方向由 sharpness 梯度决定:
```
Π_T (f(f(x)) - x*) = -η p² Π_T ∇³L(x*)[v_max]² + O(η p³)
```
- 其中 p 为法向投影坐标∇³L[v_max]² 是 sharpness 的梯度
- 这意味着:**切向漂移始终指向 sharpness 递减方向**
## 收敛定理
在以下条件下 (Theorem 4.4),梯度下降从 x* 的邻域初始化且 η = 2/λ_max(x*) 时收敛到 M
1. c₁(x*) > 0超临界分岔
2. Π_T ∇³L(x*)[v_max]² ≠ 0保证切向漂移非退化——sharpness 严格下降)
## 直观理解
法向提供**稳定性**(周期振荡不发散),切向提供**收敛性**(漂移到更低 sharpness 区域)——两者协同使 EoS 训练成为可能。
## 参考
- [[gan-bifurcation-eos]]Theorem 4.4
- [[manifold-of-minimizers]]
- [[flip-bifurcation]]
- [[edge-of-stability]]