SidneyZhang/myWiki

Files

Sidney Zhang e96b955fda

20260601

2026-06-01 10:46:01 +08:00

1.9 KiB

Raw Blame History

title, created, updated, type, tags, sources

title

created

updated

type

tags

sources

Skill as External State (Skill 作为外部状态)

2026-05-29

2026-05-29

concept

agent

skill

adaptation

philosophy

https://arxiv.org/abs/2605.23904

Skill as External State (Skill 作为外部状态)

Skill as External State 是 skillopt 的核心哲学：Agent 的适应不一定要改模型权重——skill 文档本身就是一个可训练的"外部状态"。

哲学转变

传统观点	SkillOpt 观点
Adaptation = 改模型权重	Adaptation = 优化外部文本状态
Skill 是静态配置	Skill 是可训练的 artifact
优化只能用梯度	优化可以在文本空间中进行

为什么 text-as-state 可行

Portable：skill 是 Markdown 文件，可以跨模型/跨 harness 迁移
Inspectable：人类可阅读、可审计
Compact：300–2,000 tokens，不影响推理效率
Trainable：可以用 text-space-optimizer 系统优化
Deployable：训练后的 best_skill.md 可直接部署，无需模型权重更新

与 Model-Harness 关系

Skill 作为外部状态，位于 Model 和 Harness 之间：

Model (frozen) ← Skill (trainable) ← Harness (execution)

这呼应了 model-harness-relationship 中的核心理念——适应层从"模型权重"转移到"外部结构"。

与 Heuristic Learning 的联系

heuristic-learning 将优化主体从 Model 参数扩展到 Agent 整体。SkillOpt 更进一步将 Agent 整体分解为 frozen model + trainable skill，使优化目标更精确、更可控。

相关

skillopt — 将这一哲学工程化的方法
text-space-optimizer — 文本空间优化的范式
model-harness-relationship — Model-Harness-Skill 的三元关系