20260617:目前有914 页

2026-06-17 15:02:40 +08:00
parent e96b955fda
commit 91fac5b6fc
423 changed files with 20687 additions and 34 deletions
--- a/reviews/skills-to-genes-review-20260614.md
+++ b/reviews/skills-to-genes-review-20260614.md
@@ -0,0 +1,59 @@
+---
+title: "Skills to Strategy Genes — Review 报告"
+created: 2026-06-14
+updated: 2026-06-14
+type: review
+tags: [review, agent, experience-reuse, representation]
+sources: [raw/papers/procedural-skills-to-strategy-genes-2026.md]
+---
+
+# 📌 基本信息
+
+- **论文标题:** From Procedural Skills to Strategy Genes: Towards Experience-Driven Test-Time Evolution
+- **作者:** Junjie Wang, Yiming Ren, Haoyang Zhang (清华大学, EvoMap)
+- **领域:** cs.SE, cs.CL
+- **arXiv ID:** 2604.15097v2
+- **添加时间:** 2026-06-14
+- **代码:** [skill2gep](https://github.com/EvoMap/skill2gep), [evolver](https://github.com/EvoMap/evolver)
+
+# 🎯 核心概念
+
+1. **[[strategy-gene|策略基因]]** — 紧凑(~230 tokens)的控制导向经验表示，不是技能的缩短版，而是对经验的不同抽象
+2. **[[procedural-skill|过程技能]]** — 文档导向(~2,500 tokens)的经验包，为人类阅读和审查而优化
+3. **[[gene-evolution-protocol|GEP 协议]]** — 将基因规范化为结构化可进化对象的协议层，定义 Gene/Capsule/Event 三层
+4. **[[test-time-control|测试时控制]]** — 外部化表示在不修改模型参数下影响推理时行为
+5. **[[experience-representation|经验表示]]** — 形式化框架：r = phi(H)，区分文档导向 vs 控制导向表示
+6. **[[skill-probe|技能探针]]** — 系统性分析技能控制价值的稀疏性：仅 Workflow(+1.5pp) 正面，Overview(-4.7pp) 强烈有害
+7. **[[gene-probe|基因探针]]** — Gene 优势不来自 token 预算，来自策略层组织；结构鲁棒但内容敏感
+8. **[[evolution-probe|进化探针]]** — Gene 作为进化载体优越：结构化 > 展平散文，失败警告 > 混合策略-失败
+9. **[[experience-distillation|经验蒸馏]]** — 选择性压缩而非加性积累：AVOID 项信号密度最高
+10. **[[bounded-reuse|有界复用]]** — 互补 Gene 组合比冲突组合更有害(-6.1pp)，复用有范围边界
+11. **[[gene-bench|Gene-Bench]]** — 45 场景科学代码求解基准，4,590 次试验
+12. **[[critpt|CritPt]]** — 外部物理学推理基准，gene-evolved 系统 +9.44pp
+
+# 🔗 概念网络
+
+- **核心三角:** [[strategy-gene]] ↔ [[procedural-skill]] ↔ [[experience-representation]] — 论文的核心对比轴
+- **探针三角:** [[skill-probe]] → [[gene-probe]] → [[evolution-probe]] — 三层递进分析
+- **协议层:** [[strategy-gene]] → [[gene-evolution-protocol]] — Gene 通过 GEP 成为可进化对象
+- **实证层:** [[gene-bench]] + [[critpt]] — 内部消融 + 外部验证
+- **复用原则:** [[experience-distillation]] + [[bounded-reuse]] — 如何积累 + 积累边界
+- **扩展连接:** 连接了 12 个相关概念，与 [[test-time-control]] 和 [[experience-distillation]] 形成强链接
+
+# 📚 Wiki 集成
+
+- **新增页面:** 14 个（1 论文 + 12 概念 + 1 raw 存档）
+- **链接密度:** 核心概念平均 4-5 个双向链接
+- **网络贡献:** 为 agent experience-reuse 子领域添加了系统性的表示对比分析
+
+# 💡 关键洞察
+
+**表示是一阶因素。** 这篇论文最强的论点是：在经验内容大致相同的情况下，**如何表示经验**是影响控制效果的决定性变量——不是经验量，不是经验质，而是经验的形式。这对整个 agent memory/skill 领域有深远的范式意义：我们可能一直在优化错误的东西。
+
+**"更多 ≠ 更好"的证据链异常扎实。** 三个探针从不同角度证实：
+- Skill 扩展为完整文档 → 退化
+- 向 Gene 添加 API notes/examples → 退化
+- 多个互补 Gene 组合 → 崩溃(-6.1pp)
+- 朴素追加失败历史 → 稀释
+
+这一系列收敛的证据使得"选择性压缩 > 加性积累"的结论具有很强的说服力。对实际系统设计的启示：经验管理系统的核心功能应该是**蒸馏和选择**，而非存储和检索。