Files
myWiki/concepts/sharpness.md

1.5 KiB
Raw Blame History

title, created, updated, type, tags, sources
title created updated type tags sources
Sharpness (锐度) 2026-06-23 2026-06-23 concept
optimization
hessian
EoS
gradient-descent
loss-landscape
gan-bifurcation-eos

Sharpness (锐度)

Sharpness锐度定义为损失函数 Hessian ∇²L(x) 的最大特征值 λ_max是深度学习中 edge-of-stability 现象的核心量。

在 EoS 中的角色

经典梯度下降收敛要求 η·λ_max < 2"稳定边缘"以下。EoS 训练的特征是:

  • 渐进锐化阶段λ_max 单调上升至超过 2/η
  • 自稳定阶段λ_max 在 2/η 附近振荡
  • 退火阶段λ_max 回落至阈值以下,训练收敛

关键性质

gan-bifurcation-eos 的分岔框架中:

  • Sharpness 的梯度∇³L[v_max]² 是 λ_max 在参数空间中的梯度方向
  • 切向漂移沿 sharpness 递减方向——这意味着 EoS 训练自然趋向更平坦的极小值
  • sharpness 沿两步迭代严格递减(在 Theorem 4.4 的条件下),且仅在 M 上稳定

与泛化的关联

Flat minima hypothesissharpness 较低的极小值泛化更好。EoS 训练在切向空间中自动向低 sharpness 区域漂移,提供了一种隐式正则化机制。

相关概念

  • Damian et al. (2023):三阶项贡献 sharpness 自稳定
  • Cohen et al. (2022)EoS 的 sharpness 振荡实证

参考