20260617:目前有914 页

2026-06-17 15:02:40 +08:00
parent e96b955fda
commit 91fac5b6fc
423 changed files with 20687 additions and 34 deletions
--- a/concepts/generalization-bounds.md
+++ b/concepts/generalization-bounds.md
@@ -0,0 +1,53 @@
+---
+title: "泛化界 (Generalization Bounds)"
+created: 2026-06-17
+updated: 2026-06-17
+type: concept
+tags: [theory, generalization, learning-theory]
+sources: [raw/papers/ortega-phd-thesis-2026.md]
+confidence: high
+---
+
+# 泛化界 (Generalization Bounds)
+
+泛化界是学习理论的中心问题——**量化模型在训练数据外的预期性能**。[ortega-phd-thesis|Ortega (2026)] 通过 [[pac-bayesian-bounds|PAC-Bayesian]] 和大偏差理论提供了统一的泛化界框架。
+
+## 基本形式
+
+```
+L_test ≤ L_train + complexity_penalty(n, P, δ)
+```
+
+其中 complexity_penalty 取决于：
+- 样本量 n
+- 假设空间复杂度（先验 P）
+- 置信度 δ
+
+## 经典界的困境
+
+传统界（VC 维、Rademacher 复杂度）在深度学习中**失效**：
+- 过参数化模型 VC 维 ≈ ∞ → 界退化为平凡
+- 插值区间（L_train = 0）界无意义
+
+## 论文中的突破：PAC-Chernoff 界
+
+Ortega 的 PAC-Chernoff 界：
+
+- 基于**大偏差理论**（非渐进）
+- 在插值区间仍提供非平凡界
+- 分布依赖（不假设 i.i.d.）
+- 对 [[double-descent|双下降]] 提供定量解释
+
+## 三种泛化机制的统一
+
+| 机制 | 在界中的体现 |
+|------|------------|
+| 多样性 | 降低方差项 |
+| 光滑性 | 放大率函数（集中更强） |
+| 随机性 | SGD 噪声 → 隐式 KL 正则化 |
+
+## 参考
+
+- [[pac-bayesian-bounds|PAC-Bayesian 界]]
+- [[double-descent|双下降]]
+- [[ortega-phd-thesis|论文]]