Files
myWiki/concepts/normal-tangent-decomposition.md

1.8 KiB
Raw Blame History

title, created, updated, type, tags, sources
title created updated type tags sources
Normal-Tangent Decomposition (法向-切向分解) 2026-06-23 2026-06-23 concept
gradient-descent
EoS
bifurcation
loss-landscape
overparameterization
gan-bifurcation-eos

Normal-Tangent Decomposition (法向-切向分解)

法向-切向分解是 Gan (2026b) 分析过参数化网络 EoS 动力学的核心技术:将梯度下降迭代在 manifold-of-minimizers M 附近分解为法向和切向两个子空间的独立动力学。

分解框架

在 x* ∈ M 处,将梯度下降的两步映射 f(f(x)) 分别投影到:

法向空间 N_x M*

  • 动力学经历 flip-bifurcation
  • 投影后的两步映射存在稳定不动点 x_s周期-2 轨道),条件为 first-lyapunov-coefficient
  • Π_N (f(f(x_s)) - x*) = Π_N (x_s - x*) 且 x_s 为法向投影动力学的稳定平衡点

切向空间 T_x M*

  • 两步迭代沿 M 漂移,方向由 sharpness 梯度决定:
Π_T (f(f(x)) - x*) = -η p² Π_T ∇³L(x*)[v_max]² + O(η p³)
  • 其中 p 为法向投影坐标∇³L[v_max]² 是 sharpness 的梯度
  • 这意味着:切向漂移始终指向 sharpness 递减方向

收敛定理

在以下条件下 (Theorem 4.4),梯度下降从 x* 的邻域初始化且 η = 2/λ_max(x*) 时收敛到 M

  1. c₁(x*) > 0超临界分岔
  2. Π_T ∇³L(x*)[v_max]² ≠ 0保证切向漂移非退化——sharpness 严格下降)

直观理解

法向提供稳定性(周期振荡不发散),切向提供收敛性(漂移到更低 sharpness 区域)——两者协同使 EoS 训练成为可能。

参考