3.8 KiB
3.8 KiB
title, created, updated, type, tags, sources
| title | created | updated | type | tags | sources | |||||
|---|---|---|---|---|---|---|---|---|---|---|
| Skills to Strategy Genes — Review 报告 | 2026-06-14 | 2026-06-14 | review |
|
|
📌 基本信息
- 论文标题: From Procedural Skills to Strategy Genes: Towards Experience-Driven Test-Time Evolution
- 作者: Junjie Wang, Yiming Ren, Haoyang Zhang (清华大学, EvoMap)
- 领域: cs.SE, cs.CL
- arXiv ID: 2604.15097v2
- 添加时间: 2026-06-14
- 代码: skill2gep, evolver
🎯 核心概念
- strategy-gene — 紧凑(~230 tokens)的控制导向经验表示,不是技能的缩短版,而是对经验的不同抽象
- procedural-skill — 文档导向(~2,500 tokens)的经验包,为人类阅读和审查而优化
- gene-evolution-protocol — 将基因规范化为结构化可进化对象的协议层,定义 Gene/Capsule/Event 三层
- test-time-control — 外部化表示在不修改模型参数下影响推理时行为
- experience-representation — 形式化框架:r = phi(H),区分文档导向 vs 控制导向表示
- skill-probe — 系统性分析技能控制价值的稀疏性:仅 Workflow(+1.5pp) 正面,Overview(-4.7pp) 强烈有害
- gene-probe — Gene 优势不来自 token 预算,来自策略层组织;结构鲁棒但内容敏感
- evolution-probe — Gene 作为进化载体优越:结构化 > 展平散文,失败警告 > 混合策略-失败
- experience-distillation — 选择性压缩而非加性积累:AVOID 项信号密度最高
- bounded-reuse — 互补 Gene 组合比冲突组合更有害(-6.1pp),复用有范围边界
- gene-bench — 45 场景科学代码求解基准,4,590 次试验
- critpt — 外部物理学推理基准,gene-evolved 系统 +9.44pp
🔗 概念网络
- 核心三角: strategy-gene ↔ procedural-skill ↔ experience-representation — 论文的核心对比轴
- 探针三角: skill-probe → gene-probe → evolution-probe — 三层递进分析
- 协议层: strategy-gene → gene-evolution-protocol — Gene 通过 GEP 成为可进化对象
- 实证层: gene-bench + critpt — 内部消融 + 外部验证
- 复用原则: experience-distillation + bounded-reuse — 如何积累 + 积累边界
- 扩展连接: 连接了 12 个相关概念,与 test-time-control 和 experience-distillation 形成强链接
📚 Wiki 集成
- 新增页面: 14 个(1 论文 + 12 概念 + 1 raw 存档)
- 链接密度: 核心概念平均 4-5 个双向链接
- 网络贡献: 为 agent experience-reuse 子领域添加了系统性的表示对比分析
💡 关键洞察
表示是一阶因素。 这篇论文最强的论点是:在经验内容大致相同的情况下,如何表示经验是影响控制效果的决定性变量——不是经验量,不是经验质,而是经验的形式。这对整个 agent memory/skill 领域有深远的范式意义:我们可能一直在优化错误的东西。
"更多 ≠ 更好"的证据链异常扎实。 三个探针从不同角度证实:
- Skill 扩展为完整文档 → 退化
- 向 Gene 添加 API notes/examples → 退化
- 多个互补 Gene 组合 → 崩溃(-6.1pp)
- 朴素追加失败历史 → 稀释
这一系列收敛的证据使得"选择性压缩 > 加性积累"的结论具有很强的说服力。对实际系统设计的启示:经验管理系统的核心功能应该是蒸馏和选择,而非存储和检索。