myWiki/concepts/generalization-bounds.md

---
title: "泛化界 (Generalization Bounds)"
created: 2026-06-17
updated: 2026-06-17
type: concept
tags: [theory, generalization, learning-theory]
sources: [raw/papers/ortega-phd-thesis-2026.md]
confidence: high
---

# 泛化界 (Generalization Bounds)

泛化界是学习理论的中心问题——**量化模型在训练数据外的预期性能**。[ortega-phd-thesis|Ortega (2026)] 通过 [[pac-bayesian-bounds|PAC-Bayesian]] 和大偏差理论提供了统一的泛化界框架。

## 基本形式

```
L_test ≤ L_train + complexity_penalty(n, P, δ)
```

其中 complexity_penalty 取决于：
- 样本量 n
- 假设空间复杂度（先验 P）
- 置信度 δ

## 经典界的困境

传统界（VC 维、Rademacher 复杂度）在深度学习中**失效**：
- 过参数化模型 VC 维 ≈ ∞ → 界退化为平凡
- 插值区间（L_train = 0）界无意义

## 论文中的突破：PAC-Chernoff 界

Ortega 的 PAC-Chernoff 界：

- 基于**大偏差理论**（非渐进）
- 在插值区间仍提供非平凡界
- 分布依赖（不假设 i.i.d.）
- 对 [[double-descent|双下降]] 提供定量解释

## 三种泛化机制的统一

| 机制 | 在界中的体现 |
|------|------------|
| 多样性 | 降低方差项 |
| 光滑性 | 放大率函数（集中更强） |
| 随机性 | SGD 噪声 → 隐式 KL 正则化 |

## 参考

- [[pac-bayesian-bounds|PAC-Bayesian 界]]
- [[double-descent|双下降]]
- [[ortega-phd-thesis|论文]]