20260617:目前有914 页

This commit is contained in:
2026-06-17 15:02:40 +08:00
parent e96b955fda
commit 91fac5b6fc
423 changed files with 20687 additions and 34 deletions

View File

@@ -0,0 +1,59 @@
---
title: "Skills to Strategy Genes — Review 报告"
created: 2026-06-14
updated: 2026-06-14
type: review
tags: [review, agent, experience-reuse, representation]
sources: [raw/papers/procedural-skills-to-strategy-genes-2026.md]
---
# 📌 基本信息
- **论文标题:** From Procedural Skills to Strategy Genes: Towards Experience-Driven Test-Time Evolution
- **作者:** Junjie Wang, Yiming Ren, Haoyang Zhang (清华大学, EvoMap)
- **领域:** cs.SE, cs.CL
- **arXiv ID:** 2604.15097v2
- **添加时间:** 2026-06-14
- **代码:** [skill2gep](https://github.com/EvoMap/skill2gep), [evolver](https://github.com/EvoMap/evolver)
# 🎯 核心概念
1. **[[strategy-gene|策略基因]]** — 紧凑(~230 tokens)的控制导向经验表示,不是技能的缩短版,而是对经验的不同抽象
2. **[[procedural-skill|过程技能]]** — 文档导向(~2,500 tokens)的经验包,为人类阅读和审查而优化
3. **[[gene-evolution-protocol|GEP 协议]]** — 将基因规范化为结构化可进化对象的协议层,定义 Gene/Capsule/Event 三层
4. **[[test-time-control|测试时控制]]** — 外部化表示在不修改模型参数下影响推理时行为
5. **[[experience-representation|经验表示]]** — 形式化框架r = phi(H),区分文档导向 vs 控制导向表示
6. **[[skill-probe|技能探针]]** — 系统性分析技能控制价值的稀疏性:仅 Workflow(+1.5pp) 正面Overview(-4.7pp) 强烈有害
7. **[[gene-probe|基因探针]]** — Gene 优势不来自 token 预算,来自策略层组织;结构鲁棒但内容敏感
8. **[[evolution-probe|进化探针]]** — Gene 作为进化载体优越:结构化 > 展平散文,失败警告 > 混合策略-失败
9. **[[experience-distillation|经验蒸馏]]** — 选择性压缩而非加性积累AVOID 项信号密度最高
10. **[[bounded-reuse|有界复用]]** — 互补 Gene 组合比冲突组合更有害(-6.1pp),复用有范围边界
11. **[[gene-bench|Gene-Bench]]** — 45 场景科学代码求解基准4,590 次试验
12. **[[critpt|CritPt]]** — 外部物理学推理基准gene-evolved 系统 +9.44pp
# 🔗 概念网络
- **核心三角:** [[strategy-gene]] ↔ [[procedural-skill]] ↔ [[experience-representation]] — 论文的核心对比轴
- **探针三角:** [[skill-probe]] → [[gene-probe]] → [[evolution-probe]] — 三层递进分析
- **协议层:** [[strategy-gene]] → [[gene-evolution-protocol]] — Gene 通过 GEP 成为可进化对象
- **实证层:** [[gene-bench]] + [[critpt]] — 内部消融 + 外部验证
- **复用原则:** [[experience-distillation]] + [[bounded-reuse]] — 如何积累 + 积累边界
- **扩展连接:** 连接了 12 个相关概念,与 [[test-time-control]] 和 [[experience-distillation]] 形成强链接
# 📚 Wiki 集成
- **新增页面:** 14 个1 论文 + 12 概念 + 1 raw 存档)
- **链接密度:** 核心概念平均 4-5 个双向链接
- **网络贡献:** 为 agent experience-reuse 子领域添加了系统性的表示对比分析
# 💡 关键洞察
**表示是一阶因素。** 这篇论文最强的论点是:在经验内容大致相同的情况下,**如何表示经验**是影响控制效果的决定性变量——不是经验量,不是经验质,而是经验的形式。这对整个 agent memory/skill 领域有深远的范式意义:我们可能一直在优化错误的东西。
**"更多 ≠ 更好"的证据链异常扎实。** 三个探针从不同角度证实:
- Skill 扩展为完整文档 → 退化
- 向 Gene 添加 API notes/examples → 退化
- 多个互补 Gene 组合 → 崩溃(-6.1pp)
- 朴素追加失败历史 → 稀释
这一系列收敛的证据使得"选择性压缩 > 加性积累"的结论具有很强的说服力。对实际系统设计的启示:经验管理系统的核心功能应该是**蒸馏和选择**,而非存储和检索。