Files
myWiki/reviews/dead-directions-20260610.md

46 lines
2.1 KiB
Markdown
Raw Blame History

This file contains ambiguous Unicode characters

This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.

---
title: "Review: Dead Directions — Geometric Singular Learning"
created: 2026-06-10
type: review
paper: "[[dead-directions-geometric-singular-learning]]"
---
# Review: Dead Directions — Geometric Singular Learning
📌 **基本信息**
- 论文Dead Directions: Geometric Singular Learning
- 作者Tejas Pradeep Shirodkar (IIIT Hyderabad)
- 领域:奇异学习理论 × 信息几何 × 深度学习理论
- arXiv2606.05957v1 [cs.LG, stat.ML], 2026 | 139 pages
🎯 **核心贡献**
1. **Dead Direction 桥接原语** — 同一向量同时是 Amari 的 Fisher 退化方向和 Watanabe 的奇异集切向量。KL 阶可在原始坐标中从 Fisher 曲率衰减率恢复。
2. **无需广中平祐消解** — 传统 SLT 需要 blow-up对百万参数网络不可行本文在原始参数坐标中直接计算 lambda。
3. **单 Checkpoint 读取 Watanabe 三元组** — 从一次前向+反向传播计算 (lambda, m, nu),无需 MCMC 后验采样。
4. **DDCAdam 优化器** — 标准 Adam 破坏奇异几何DDCAdam 保持 G-等变性,使训练轨迹中的 SLT 信号可读。
🔗 **概念网络**
```
Dead Direction ←→ KL Order ←→ RLCT (lambda)
↓ ↓
Fisher Metric (Info Geometry) → Singular Learning Theory
↓ ↓
DDCAdam ←→ Gauge Quotient Watanabe's Triple (lambda,m,nu)
```
📊 **Wiki 集成**
- 新增页面9 个1 论文 + 8 概念)
- 链接完整性100%
- 总规模729 → **738**
💡 **关键洞察**
这篇 139 页的论文解决了一个困扰领域二十年的问题:**SLT 和信息几何使用几乎不相交的词汇描述同一参数空间**。Dead Direction 是第一个在两个框架中具有明确双重解读的数学对象KL 阶是第一个可被两方计算的桥接不变量。
实践意义巨大:首次使 SLT 分析在**实际规模的深度网络**上可行——从单个 checkpoint 的梯度信息中直接提取泛化理论的不变量,无需 blow-up无需后验采样。这对理解大模型的泛化行为可能具有基础性影响。