myWiki/concepts/sharpness.md

---
title: "Sharpness (锐度)"
created: 2026-06-23
updated: 2026-06-23
type: concept
tags: [optimization, hessian, EoS, gradient-descent, loss-landscape]
sources: [gan-bifurcation-eos]
---

# Sharpness (锐度)

Sharpness（锐度）定义为损失函数 Hessian ∇²L(x) 的**最大特征值** λ_max，是深度学习中 [[edge-of-stability|EoS]] 现象的核心量。

## 在 EoS 中的角色

经典梯度下降收敛要求 **η·λ_max < 2**（"稳定边缘"以下）。EoS 训练的特征是：
- 渐进锐化阶段：λ_max 单调上升至超过 2/η
- 自稳定阶段：λ_max 在 2/η 附近振荡
- 退火阶段：λ_max 回落至阈值以下，训练收敛

## 关键性质

在 [[gan-bifurcation-eos|Gan (2026b)]] 的分岔框架中：

- **Sharpness 的梯度**：∇³L[v_max]² 是 λ_max 在参数空间中的梯度方向
- 切向漂移沿 **sharpness 递减**方向——这意味着 EoS 训练自然趋向更平坦的极小值
- sharpness 沿两步迭代严格递减（在 Theorem 4.4 的条件下），且仅在 M 上稳定

## 与泛化的关联

Flat minima hypothesis：sharpness 较低的极小值泛化更好。EoS 训练在切向空间中自动向低 sharpness 区域漂移，提供了一种隐式正则化机制。

## 相关概念

- Damian et al. (2023)：三阶项贡献 sharpness 自稳定
- Cohen et al. (2022)：EoS 的 sharpness 振荡实证

## 参考

- [[edge-of-stability]]
- [[gan-bifurcation-eos]]
- [[manifold-of-minimizers]]
- [[normal-tangent-decomposition]]