myWiki/reviews/skills-to-genes-review-20260614.md

---
title: "Skills to Strategy Genes — Review 报告"
created: 2026-06-14
updated: 2026-06-14
type: review
tags: [review, agent, experience-reuse, representation]
sources: [raw/papers/procedural-skills-to-strategy-genes-2026.md]
---

# 📌 基本信息

- **论文标题:** From Procedural Skills to Strategy Genes: Towards Experience-Driven Test-Time Evolution
- **作者:** Junjie Wang, Yiming Ren, Haoyang Zhang (清华大学, EvoMap)
- **领域:** cs.SE, cs.CL
- **arXiv ID:** 2604.15097v2
- **添加时间:** 2026-06-14
- **代码:** [skill2gep](https://github.com/EvoMap/skill2gep), [evolver](https://github.com/EvoMap/evolver)

# 🎯 核心概念

1. **[[strategy-gene|策略基因]]** — 紧凑(~230 tokens)的控制导向经验表示，不是技能的缩短版，而是对经验的不同抽象
2. **[[procedural-skill|过程技能]]** — 文档导向(~2,500 tokens)的经验包，为人类阅读和审查而优化
3. **[[gene-evolution-protocol|GEP 协议]]** — 将基因规范化为结构化可进化对象的协议层，定义 Gene/Capsule/Event 三层
4. **[[test-time-control|测试时控制]]** — 外部化表示在不修改模型参数下影响推理时行为
5. **[[experience-representation|经验表示]]** — 形式化框架：r = phi(H)，区分文档导向 vs 控制导向表示
6. **[[skill-probe|技能探针]]** — 系统性分析技能控制价值的稀疏性：仅 Workflow(+1.5pp) 正面，Overview(-4.7pp) 强烈有害
7. **[[gene-probe|基因探针]]** — Gene 优势不来自 token 预算，来自策略层组织；结构鲁棒但内容敏感
8. **[[evolution-probe|进化探针]]** — Gene 作为进化载体优越：结构化 > 展平散文，失败警告 > 混合策略-失败
9. **[[experience-distillation|经验蒸馏]]** — 选择性压缩而非加性积累：AVOID 项信号密度最高
10. **[[bounded-reuse|有界复用]]** — 互补 Gene 组合比冲突组合更有害(-6.1pp)，复用有范围边界
11. **[[gene-bench|Gene-Bench]]** — 45 场景科学代码求解基准，4,590 次试验
12. **[[critpt|CritPt]]** — 外部物理学推理基准，gene-evolved 系统 +9.44pp

# 🔗 概念网络

- **核心三角:** [[strategy-gene]] ↔ [[procedural-skill]] ↔ [[experience-representation]] — 论文的核心对比轴
- **探针三角:** [[skill-probe]] → [[gene-probe]] → [[evolution-probe]] — 三层递进分析
- **协议层:** [[strategy-gene]] → [[gene-evolution-protocol]] — Gene 通过 GEP 成为可进化对象
- **实证层:** [[gene-bench]] + [[critpt]] — 内部消融 + 外部验证
- **复用原则:** [[experience-distillation]] + [[bounded-reuse]] — 如何积累 + 积累边界
- **扩展连接:** 连接了 12 个相关概念，与 [[test-time-control]] 和 [[experience-distillation]] 形成强链接

# 📚 Wiki 集成

- **新增页面:** 14 个（1 论文 + 12 概念 + 1 raw 存档）
- **链接密度:** 核心概念平均 4-5 个双向链接
- **网络贡献:** 为 agent experience-reuse 子领域添加了系统性的表示对比分析

# 💡 关键洞察

**表示是一阶因素。** 这篇论文最强的论点是：在经验内容大致相同的情况下，**如何表示经验**是影响控制效果的决定性变量——不是经验量，不是经验质，而是经验的形式。这对整个 agent memory/skill 领域有深远的范式意义：我们可能一直在优化错误的东西。

**"更多 ≠ 更好"的证据链异常扎实。** 三个探针从不同角度证实：
- Skill 扩展为完整文档 → 退化
- 向 Gene 添加 API notes/examples → 退化
- 多个互补 Gene 组合 → 崩溃(-6.1pp)
- 朴素追加失败历史 → 稀释

这一系列收敛的证据使得"选择性压缩 > 加性积累"的结论具有很强的说服力。对实际系统设计的启示：经验管理系统的核心功能应该是**蒸馏和选择**，而非存储和检索。