SidneyZhang/myWiki

Files

Sidney Zhang 91fac5b6fc

20260617:目前有914 页

2026-06-17 15:02:40 +08:00

3.8 KiB

Raw Blame History

title, created, updated, type, tags, sources

title

created

updated

type

tags

sources

Skills to Strategy Genes — Review 报告

2026-06-14

2026-06-14

review

review

agent

experience-reuse

representation

raw/papers/procedural-skills-to-strategy-genes-2026.md

📌 基本信息

论文标题: From Procedural Skills to Strategy Genes: Towards Experience-Driven Test-Time Evolution
作者: Junjie Wang, Yiming Ren, Haoyang Zhang (清华大学, EvoMap)
领域: cs.SE, cs.CL
arXiv ID: 2604.15097v2
添加时间: 2026-06-14
代码: skill2gep, evolver

🎯 核心概念

strategy-gene — 紧凑(~230 tokens)的控制导向经验表示，不是技能的缩短版，而是对经验的不同抽象
procedural-skill — 文档导向(~2,500 tokens)的经验包，为人类阅读和审查而优化
gene-evolution-protocol — 将基因规范化为结构化可进化对象的协议层，定义 Gene/Capsule/Event 三层
test-time-control — 外部化表示在不修改模型参数下影响推理时行为
experience-representation — 形式化框架：r = phi(H)，区分文档导向 vs 控制导向表示
skill-probe — 系统性分析技能控制价值的稀疏性：仅 Workflow(+1.5pp) 正面，Overview(-4.7pp) 强烈有害
gene-probe — Gene 优势不来自 token 预算，来自策略层组织；结构鲁棒但内容敏感
evolution-probe — Gene 作为进化载体优越：结构化 > 展平散文，失败警告 > 混合策略-失败
experience-distillation — 选择性压缩而非加性积累：AVOID 项信号密度最高
bounded-reuse — 互补 Gene 组合比冲突组合更有害(-6.1pp)，复用有范围边界
gene-bench — 45 场景科学代码求解基准，4,590 次试验
critpt — 外部物理学推理基准，gene-evolved 系统 +9.44pp

🔗 概念网络

核心三角: strategy-gene ↔ procedural-skill ↔ experience-representation — 论文的核心对比轴
探针三角: skill-probe → gene-probe → evolution-probe — 三层递进分析
协议层: strategy-gene → gene-evolution-protocol — Gene 通过 GEP 成为可进化对象
实证层: gene-bench + critpt — 内部消融 + 外部验证
复用原则: experience-distillation + bounded-reuse — 如何积累 + 积累边界
扩展连接: 连接了 12 个相关概念，与 test-time-control 和 experience-distillation 形成强链接

📚 Wiki 集成

新增页面: 14 个（1 论文 + 12 概念 + 1 raw 存档）
链接密度: 核心概念平均 4-5 个双向链接
网络贡献: 为 agent experience-reuse 子领域添加了系统性的表示对比分析

💡 关键洞察

表示是一阶因素。 这篇论文最强的论点是：在经验内容大致相同的情况下，如何表示经验是影响控制效果的决定性变量——不是经验量，不是经验质，而是经验的形式。这对整个 agent memory/skill 领域有深远的范式意义：我们可能一直在优化错误的东西。

"更多 ≠ 更好"的证据链异常扎实。 三个探针从不同角度证实：

Skill 扩展为完整文档 → 退化
向 Gene 添加 API notes/examples → 退化
多个互补 Gene 组合 → 崩溃(-6.1pp)
朴素追加失败历史 → 稀释

这一系列收敛的证据使得"选择性压缩 > 加性积累"的结论具有很强的说服力。对实际系统设计的启示：经验管理系统的核心功能应该是蒸馏和选择，而非存储和检索。