Files
myWiki/reviews/skills-to-genes-review-20260614.md

3.8 KiB
Raw Blame History

title, created, updated, type, tags, sources
title created updated type tags sources
Skills to Strategy Genes — Review 报告 2026-06-14 2026-06-14 review
review
agent
experience-reuse
representation
raw/papers/procedural-skills-to-strategy-genes-2026.md

📌 基本信息

  • 论文标题: From Procedural Skills to Strategy Genes: Towards Experience-Driven Test-Time Evolution
  • 作者: Junjie Wang, Yiming Ren, Haoyang Zhang (清华大学, EvoMap)
  • 领域: cs.SE, cs.CL
  • arXiv ID: 2604.15097v2
  • 添加时间: 2026-06-14
  • 代码: skill2gep, evolver

🎯 核心概念

  1. strategy-gene — 紧凑(~230 tokens)的控制导向经验表示,不是技能的缩短版,而是对经验的不同抽象
  2. procedural-skill — 文档导向(~2,500 tokens)的经验包,为人类阅读和审查而优化
  3. gene-evolution-protocol — 将基因规范化为结构化可进化对象的协议层,定义 Gene/Capsule/Event 三层
  4. test-time-control — 外部化表示在不修改模型参数下影响推理时行为
  5. experience-representation — 形式化框架r = phi(H),区分文档导向 vs 控制导向表示
  6. skill-probe — 系统性分析技能控制价值的稀疏性:仅 Workflow(+1.5pp) 正面Overview(-4.7pp) 强烈有害
  7. gene-probe — Gene 优势不来自 token 预算,来自策略层组织;结构鲁棒但内容敏感
  8. evolution-probe — Gene 作为进化载体优越:结构化 > 展平散文,失败警告 > 混合策略-失败
  9. experience-distillation — 选择性压缩而非加性积累AVOID 项信号密度最高
  10. bounded-reuse — 互补 Gene 组合比冲突组合更有害(-6.1pp),复用有范围边界
  11. gene-bench — 45 场景科学代码求解基准4,590 次试验
  12. critpt — 外部物理学推理基准gene-evolved 系统 +9.44pp

🔗 概念网络

📚 Wiki 集成

  • 新增页面: 14 个1 论文 + 12 概念 + 1 raw 存档)
  • 链接密度: 核心概念平均 4-5 个双向链接
  • 网络贡献: 为 agent experience-reuse 子领域添加了系统性的表示对比分析

💡 关键洞察

表示是一阶因素。 这篇论文最强的论点是:在经验内容大致相同的情况下,如何表示经验是影响控制效果的决定性变量——不是经验量,不是经验质,而是经验的形式。这对整个 agent memory/skill 领域有深远的范式意义:我们可能一直在优化错误的东西。

"更多 ≠ 更好"的证据链异常扎实。 三个探针从不同角度证实:

  • Skill 扩展为完整文档 → 退化
  • 向 Gene 添加 API notes/examples → 退化
  • 多个互补 Gene 组合 → 崩溃(-6.1pp)
  • 朴素追加失败历史 → 稀释

这一系列收敛的证据使得"选择性压缩 > 加性积累"的结论具有很强的说服力。对实际系统设计的启示:经验管理系统的核心功能应该是蒸馏和选择,而非存储和检索。