20260617:目前有914 页

This commit is contained in:
2026-06-17 15:02:40 +08:00
parent e96b955fda
commit 91fac5b6fc
423 changed files with 20687 additions and 34 deletions

69
concepts/strategy-gene.md Normal file
View File

@@ -0,0 +1,69 @@
---
title: "策略基因 (Strategy Gene)"
created: 2026-06-14
updated: 2026-06-14
type: concept
tags: [agent, experience-reuse, test-time-control, representation]
sources: [raw/papers/procedural-skills-to-strategy-genes-2026.md]
---
# 策略基因 (Strategy Gene)
由 Wang et al. (2026) 在 [[procedural-skills-to-strategy-genes|Skills to Strategy Genes]] 中提出:一种**紧凑的、控制导向的经验表示**,从先前的问题解决经验中蒸馏而来。
## 定义
策略基因是一种控制导向的可复用经验表示,其目标不是文档完整性,而是**紧凑性、结构清晰性、行为导向性和失败感知性**。
形式定义:给定技能包 s 或轨迹集 H基因通过蒸馏映射获得
```
g = psi(s) 或 g = psi(H), g in G
```
基因结构:`g = (m, u, pi, alpha, c, v)`
- **m**: 任务匹配信号(关键词/触发线索)
- **u**: 紧凑摘要(一句话意图描述)
- **pi**: 策略步骤(含 AVOID 项)
- **alpha**: 失败感知的 AVOID 线索
- **c**: 可选执行约束
- **v**: 可选验证钩子
## 操作化形式
```
<strategy-gene>
Domain keywords: uv-vis, peak detection, FWHM, unit conversion
Summary: Detect peaks and compute wavelength-domain peak properties correctly
Strategy:
1. Detect peaks with prominence-based criteria
2. Convert min_distance into sample-index units before peak detection
3. AVOID: Report FWHM only after converting peak_widths outputs back to wavelength units
</strategy-gene>
```
典型规模约 230 tokens。
## 与过程技能的区别
| 维度 | 策略基因 (Gene) | 过程技能 (Skill) |
|------|----------------|-----------------|
| 目标 | 控制导向 | 文档导向 |
| 规模 | ~230 tokens | ~2,500 tokens |
| 组织逻辑 | 控制逻辑 | 文档逻辑 |
| 优先级 | 信号密度、适用范围、失败显著性 | 可读性、完整性 |
策略基因**不是技能的缩短版**,而是对可复用经验的**不同抽象**。
## 关键发现
- Gene 整体 +3.0pp vs 基线Skill -1.1pp
- Gene 对内容扰动敏感(错误算法→-5.2pp),但对结构扰动鲁棒(逆序仍保持 +2.8pp
- 重新添加文档材料API notes, examples通常削弱而非增强 Gene
- 单一靶向 Gene 优于多 Gene 组合
## 参考
- [[procedural-skills-to-strategy-genes|Skills to Strategy Genes]] — 提出论文
- [[gene-evolution-protocol|GEP 协议]] — Gene 的协议化层
- [[procedural-skill|过程技能]] — 对比对象
- [[experience-distillation|经验蒸馏]] — Gene 的提取过程