20260617:目前有914 页
This commit is contained in:
52
concepts/experience-distillation.md
Normal file
52
concepts/experience-distillation.md
Normal file
@@ -0,0 +1,52 @@
|
||||
---
|
||||
title: "经验蒸馏 (Experience Distillation)"
|
||||
created: 2026-06-14
|
||||
updated: 2026-06-14
|
||||
type: concept
|
||||
tags: [agent, experience-reuse, compression, gene]
|
||||
sources: [raw/papers/procedural-skills-to-strategy-genes-2026.md]
|
||||
---
|
||||
|
||||
# 经验蒸馏 (Experience Distillation)
|
||||
|
||||
Wang et al. (2026) 中隐含的核心操作:将丰富的源经验(技能包、轨迹)压缩为紧凑的控制导向表示。
|
||||
|
||||
## 蒸馏映射
|
||||
|
||||
形式化:给定源经验 z(技能 s、轨迹集 H、或已验证的 Capsule C):
|
||||
|
||||
```
|
||||
g = psi(z), g in G
|
||||
```
|
||||
|
||||
其中 psi 提取紧凑的控制导向表示。蒸馏不是简单的截断或摘要——它是对经验的**重新抽象**。
|
||||
|
||||
## 为什么蒸馏必要
|
||||
|
||||
过程技能包含大量文档导向材料(overview, API notes, examples, scripts),其中仅约 10-15% 提供有意义的控制价值。其余部分在推理时构成**信息过载**。
|
||||
|
||||
经验蒸馏的目标:
|
||||
- 提高**信号密度**(每 token 的控制相关性)
|
||||
- 明确**适用范围边界**(何时适用、何时不适用)
|
||||
- 增强**失败显著性**(明确标注 AVOID 项)
|
||||
|
||||
## 关键证据
|
||||
|
||||
1. **Skill-Workflow (+1.5pp)** 是技能包中唯一明确有用的部分——这恰好是最接近 Gene 策略层的内容
|
||||
2. **Skill-Overview (-4.7pp)** 是纯文档材料,强烈有害
|
||||
3. **匹配预算 Skill 片段**改善但仍低于 Gene——蒸馏不只是压缩
|
||||
4. **失败警告仅 (54.4%, +4.6pp)** 超过所有混合条件——蒸馏应选择性而非加性
|
||||
|
||||
## 实践启示
|
||||
|
||||
- 蒸馏应从**过程性内容**(workflow/strategy)而非描述性内容开始
|
||||
- **AVOID 项**(失败感知线索)是信号密度最高的信息
|
||||
- 朴素追加更多历史**不会**改善控制——选择性压缩才有
|
||||
- 蒸馏应保持**结构化可编辑性**,而非展平为散文
|
||||
|
||||
## 参考
|
||||
|
||||
- [[procedural-skills-to-strategy-genes|Skills to Strategy Genes]] — 蒸馏的实证基础
|
||||
- [[strategy-gene|策略基因]] — 蒸馏的目标产物
|
||||
- [[gene-evolution-protocol|GEP]] — 蒸馏的协议化框架
|
||||
- [[procedural-skill|过程技能]] — 蒸馏的源材料
|
||||
Reference in New Issue
Block a user