Files
myWiki/reviews/skills-to-genes-review-20260614.md

60 lines
3.8 KiB
Markdown
Raw Blame History

This file contains ambiguous Unicode characters

This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.

---
title: "Skills to Strategy Genes — Review 报告"
created: 2026-06-14
updated: 2026-06-14
type: review
tags: [review, agent, experience-reuse, representation]
sources: [raw/papers/procedural-skills-to-strategy-genes-2026.md]
---
# 📌 基本信息
- **论文标题:** From Procedural Skills to Strategy Genes: Towards Experience-Driven Test-Time Evolution
- **作者:** Junjie Wang, Yiming Ren, Haoyang Zhang (清华大学, EvoMap)
- **领域:** cs.SE, cs.CL
- **arXiv ID:** 2604.15097v2
- **添加时间:** 2026-06-14
- **代码:** [skill2gep](https://github.com/EvoMap/skill2gep), [evolver](https://github.com/EvoMap/evolver)
# 🎯 核心概念
1. **[[strategy-gene|策略基因]]** — 紧凑(~230 tokens)的控制导向经验表示,不是技能的缩短版,而是对经验的不同抽象
2. **[[procedural-skill|过程技能]]** — 文档导向(~2,500 tokens)的经验包,为人类阅读和审查而优化
3. **[[gene-evolution-protocol|GEP 协议]]** — 将基因规范化为结构化可进化对象的协议层,定义 Gene/Capsule/Event 三层
4. **[[test-time-control|测试时控制]]** — 外部化表示在不修改模型参数下影响推理时行为
5. **[[experience-representation|经验表示]]** — 形式化框架r = phi(H),区分文档导向 vs 控制导向表示
6. **[[skill-probe|技能探针]]** — 系统性分析技能控制价值的稀疏性:仅 Workflow(+1.5pp) 正面Overview(-4.7pp) 强烈有害
7. **[[gene-probe|基因探针]]** — Gene 优势不来自 token 预算,来自策略层组织;结构鲁棒但内容敏感
8. **[[evolution-probe|进化探针]]** — Gene 作为进化载体优越:结构化 > 展平散文,失败警告 > 混合策略-失败
9. **[[experience-distillation|经验蒸馏]]** — 选择性压缩而非加性积累AVOID 项信号密度最高
10. **[[bounded-reuse|有界复用]]** — 互补 Gene 组合比冲突组合更有害(-6.1pp),复用有范围边界
11. **[[gene-bench|Gene-Bench]]** — 45 场景科学代码求解基准4,590 次试验
12. **[[critpt|CritPt]]** — 外部物理学推理基准gene-evolved 系统 +9.44pp
# 🔗 概念网络
- **核心三角:** [[strategy-gene]] ↔ [[procedural-skill]] ↔ [[experience-representation]] — 论文的核心对比轴
- **探针三角:** [[skill-probe]] → [[gene-probe]] → [[evolution-probe]] — 三层递进分析
- **协议层:** [[strategy-gene]] → [[gene-evolution-protocol]] — Gene 通过 GEP 成为可进化对象
- **实证层:** [[gene-bench]] + [[critpt]] — 内部消融 + 外部验证
- **复用原则:** [[experience-distillation]] + [[bounded-reuse]] — 如何积累 + 积累边界
- **扩展连接:** 连接了 12 个相关概念,与 [[test-time-control]] 和 [[experience-distillation]] 形成强链接
# 📚 Wiki 集成
- **新增页面:** 14 个1 论文 + 12 概念 + 1 raw 存档)
- **链接密度:** 核心概念平均 4-5 个双向链接
- **网络贡献:** 为 agent experience-reuse 子领域添加了系统性的表示对比分析
# 💡 关键洞察
**表示是一阶因素。** 这篇论文最强的论点是:在经验内容大致相同的情况下,**如何表示经验**是影响控制效果的决定性变量——不是经验量,不是经验质,而是经验的形式。这对整个 agent memory/skill 领域有深远的范式意义:我们可能一直在优化错误的东西。
**"更多 ≠ 更好"的证据链异常扎实。** 三个探针从不同角度证实:
- Skill 扩展为完整文档 → 退化
- 向 Gene 添加 API notes/examples → 退化
- 多个互补 Gene 组合 → 崩溃(-6.1pp)
- 朴素追加失败历史 → 稀释
这一系列收敛的证据使得"选择性压缩 > 加性积累"的结论具有很强的说服力。对实际系统设计的启示:经验管理系统的核心功能应该是**蒸馏和选择**,而非存储和检索。