SidneyZhang/myWiki

Files

Sidney Zhang 91fac5b6fc

20260617:目前有914 页

2026-06-17 15:02:40 +08:00

1.5 KiB

Raw Blame History

title, created, updated, type, tags, sources, confidence

title

created

updated

type

tags

sources

confidence

双下降 (Double Descent)

2026-06-17

2026-06-17

concept

theory

generalization

deep-learning

phenomena

raw/papers/ortega-phd-thesis-2026.md

high

双下降 (Double Descent)

双下降是深度学习中模型复杂度增加时测试误差先降、后升、再降的经验现象——违背经典 U 型曲线的直觉。ortega-phd-thesis 通过 PAC-Chernoff 界提供了定量解释。

三个阶段

测试误差
  ↑
  |    ↓ (classical)
  |       ↑ (插值阈值)
  |           ↓ (过参数化区间)
  └──────────────→ 模型复杂度

经典区间：偏差-方差权衡，U 型最低点
插值阈值：模型刚好拟合训练数据 → 误差峰值
过参数化区间：越过插值 → 误差再次下降

PAC-Chernoff 解释

传统界在插值区间失效（L_train ≈ 0 → bound ≈ ∞）。Ortega 的大偏差界：

非渐进：不假设 n→∞
率函数：捕获了损失景观的局部几何
在插值点：率函数 I(0) 分母为模型灵活性
过参数化后：增加灵活性 → 率函数增大 → 界收紧

与三个泛化机制的关联

光滑性：平坦极小值 → 率函数更陡 → 界更紧
多样性：集成 → 有效方差减小
随机性：SGD 噪声 → 自然偏向平坦极小值

参考