20260617:目前有914 页
This commit is contained in:
59
reviews/skills-to-genes-review-20260614.md
Normal file
59
reviews/skills-to-genes-review-20260614.md
Normal file
@@ -0,0 +1,59 @@
|
||||
---
|
||||
title: "Skills to Strategy Genes — Review 报告"
|
||||
created: 2026-06-14
|
||||
updated: 2026-06-14
|
||||
type: review
|
||||
tags: [review, agent, experience-reuse, representation]
|
||||
sources: [raw/papers/procedural-skills-to-strategy-genes-2026.md]
|
||||
---
|
||||
|
||||
# 📌 基本信息
|
||||
|
||||
- **论文标题:** From Procedural Skills to Strategy Genes: Towards Experience-Driven Test-Time Evolution
|
||||
- **作者:** Junjie Wang, Yiming Ren, Haoyang Zhang (清华大学, EvoMap)
|
||||
- **领域:** cs.SE, cs.CL
|
||||
- **arXiv ID:** 2604.15097v2
|
||||
- **添加时间:** 2026-06-14
|
||||
- **代码:** [skill2gep](https://github.com/EvoMap/skill2gep), [evolver](https://github.com/EvoMap/evolver)
|
||||
|
||||
# 🎯 核心概念
|
||||
|
||||
1. **[[strategy-gene|策略基因]]** — 紧凑(~230 tokens)的控制导向经验表示,不是技能的缩短版,而是对经验的不同抽象
|
||||
2. **[[procedural-skill|过程技能]]** — 文档导向(~2,500 tokens)的经验包,为人类阅读和审查而优化
|
||||
3. **[[gene-evolution-protocol|GEP 协议]]** — 将基因规范化为结构化可进化对象的协议层,定义 Gene/Capsule/Event 三层
|
||||
4. **[[test-time-control|测试时控制]]** — 外部化表示在不修改模型参数下影响推理时行为
|
||||
5. **[[experience-representation|经验表示]]** — 形式化框架:r = phi(H),区分文档导向 vs 控制导向表示
|
||||
6. **[[skill-probe|技能探针]]** — 系统性分析技能控制价值的稀疏性:仅 Workflow(+1.5pp) 正面,Overview(-4.7pp) 强烈有害
|
||||
7. **[[gene-probe|基因探针]]** — Gene 优势不来自 token 预算,来自策略层组织;结构鲁棒但内容敏感
|
||||
8. **[[evolution-probe|进化探针]]** — Gene 作为进化载体优越:结构化 > 展平散文,失败警告 > 混合策略-失败
|
||||
9. **[[experience-distillation|经验蒸馏]]** — 选择性压缩而非加性积累:AVOID 项信号密度最高
|
||||
10. **[[bounded-reuse|有界复用]]** — 互补 Gene 组合比冲突组合更有害(-6.1pp),复用有范围边界
|
||||
11. **[[gene-bench|Gene-Bench]]** — 45 场景科学代码求解基准,4,590 次试验
|
||||
12. **[[critpt|CritPt]]** — 外部物理学推理基准,gene-evolved 系统 +9.44pp
|
||||
|
||||
# 🔗 概念网络
|
||||
|
||||
- **核心三角:** [[strategy-gene]] ↔ [[procedural-skill]] ↔ [[experience-representation]] — 论文的核心对比轴
|
||||
- **探针三角:** [[skill-probe]] → [[gene-probe]] → [[evolution-probe]] — 三层递进分析
|
||||
- **协议层:** [[strategy-gene]] → [[gene-evolution-protocol]] — Gene 通过 GEP 成为可进化对象
|
||||
- **实证层:** [[gene-bench]] + [[critpt]] — 内部消融 + 外部验证
|
||||
- **复用原则:** [[experience-distillation]] + [[bounded-reuse]] — 如何积累 + 积累边界
|
||||
- **扩展连接:** 连接了 12 个相关概念,与 [[test-time-control]] 和 [[experience-distillation]] 形成强链接
|
||||
|
||||
# 📚 Wiki 集成
|
||||
|
||||
- **新增页面:** 14 个(1 论文 + 12 概念 + 1 raw 存档)
|
||||
- **链接密度:** 核心概念平均 4-5 个双向链接
|
||||
- **网络贡献:** 为 agent experience-reuse 子领域添加了系统性的表示对比分析
|
||||
|
||||
# 💡 关键洞察
|
||||
|
||||
**表示是一阶因素。** 这篇论文最强的论点是:在经验内容大致相同的情况下,**如何表示经验**是影响控制效果的决定性变量——不是经验量,不是经验质,而是经验的形式。这对整个 agent memory/skill 领域有深远的范式意义:我们可能一直在优化错误的东西。
|
||||
|
||||
**"更多 ≠ 更好"的证据链异常扎实。** 三个探针从不同角度证实:
|
||||
- Skill 扩展为完整文档 → 退化
|
||||
- 向 Gene 添加 API notes/examples → 退化
|
||||
- 多个互补 Gene 组合 → 崩溃(-6.1pp)
|
||||
- 朴素追加失败历史 → 稀释
|
||||
|
||||
这一系列收敛的证据使得"选择性压缩 > 加性积累"的结论具有很强的说服力。对实际系统设计的启示:经验管理系统的核心功能应该是**蒸馏和选择**,而非存储和检索。
|
||||
Reference in New Issue
Block a user