Files
myWiki/papers/zhou-agent-skills-survey-2026.md

94 lines
4.4 KiB
Markdown
Raw Blame History

This file contains ambiguous Unicode characters

This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.

---
title: "A Comprehensive Survey on Agent Skills — 综述"
created: 2026-06-19
updated: 2026-06-19
type: paper
tags: [agent-skills, survey, skill-lifecycle, llm-agents, procedural-knowledge]
sources:
- https://arxiv.org/abs/2605.07358
- https://github.com/JayLZhou/Awesome-Agent-Skills
---
# Agent Skills 综述:分类、技术与应用
> **Yingli Zhou, Shu Wang, Yaodong Su, Wenchuan Du, Yixiang Fang, Xuemin Lin** (CUHK-Shenzhen) · 2026 · arXiv:2605.07358
## 核心问题
LLM agent 在实际部署中面临一个核心瓶颈:**过程性鸿沟procedural gap**——仅靠工具访问tool access不等同于知道何时调用、如何编排、怎样验证。这篇综述以 **agent skill** 为中心视角,定义其为"可复用的过程性构件,在任务特定约束下协调工具、内存和运行时上下文"。
## 核心洞察
Agent 与 skill 是互补的层级关系:
- **Agent** 负责高层推理和规划("做什么"
- **Skill** 构成操作层,负责可靠、可复用、可组合的执行("怎么做"
Skill 可视为 agent 的"肌肉记忆"——将过程性 know-how 外化为可持久化、可检索、可修订的显式构件。
## 方法论框架
论文围绕 skill 生命周期的四个阶段组织文献:
### 1. Skill Representation表示
基于资源类型分类:
- **文本型Text-Based**:参考文档、模板、检查清单
- **代码型Code-Backed**可执行脚本、包装器、API
- **混合型Hybrid**:文本 + 代码结合,兼顾可解释性和执行确定性
形式化定义:**S = (M, R, C)**——指令文档 + 辅助资源 + 适用条件。
### 2. Skill Acquisition获取
四种获取路径:
- **人工来源Human-Derived**:领域专家编写,精度高但扩展性差
- **经验来源Experience-Derived**:从执行轨迹中抽象(选择→摘要→记忆组织→过程打包),研究最活跃
- **任务来源Task-Derived**:按需构建,新任务无法等待专家或经验积累时使用
- **语料来源Corpus-Derived**:从文档、仓库、数据集、接口轨迹中提取
四种路径互补而非竞争——最强大的 skill 库来自它们的组合。
### 3. Skill Retrieval & Selection检索与选择
分为两阶段:
- **检索**:稠密嵌入、稀疏关键词、生成式、结构感知(层级 + 依赖图)
- **选择**:上下文感知、技能组合、成本/效用感知、反馈驱动重排序
关键洞察skill 检索不同于文档检索——skill 是可执行单元,语义相关不等于可执行。必须考虑前置条件、组合兼容性、成本收益。
### 4. Skill Evolution演化
五个子阶段:
- **Skill Revision**:反馈驱动的技能修订
- **Skill Validation**:修订后的生存检查(测试、回滚)
- **Policy Coupling**:策略与技能库共同优化(如 SkillRL
- **Repository Evolution**:跨 artifact 的规模化演化
- **Runtime Governance**:检索→路由→信任检查→执行→退役的安全闭环
## 代表性平台
| 平台 | 规模 |
|------|------|
| SkillNet | 300k+ |
| ClawHub | 40k+ |
| SkillHub | 80k+ |
| SkillsMP | 700k+ |
| Skills.sh | 90k+ |
## 与 Hermes 的关联
Hermes 的 skill 体系SKILL.md + references/templates/scripts天然覆盖了论文中定义的核心结构 (M, R, C)。论文列出的开放挑战——统一 skill schema、资源感知联合优化、因果诊断、生命周期鲁棒性——也是 Hermes skill 系统可以演进的方向。
## 关键概念
- [[agent-skill|Agent Skill]] — 形式化定义与核心属性
- [[procedural-gap|过程性鸿沟]] — 工具访问与鲁棒执行之间的桥梁
- [[skill-lifecycle|Skill 生命周期]] — 四阶段框架
- [[skill-representation|Skill 表示]] — 文本/代码/混合三种形态
- [[skill-acquisition|Skill 获取]] — 四种获取路径
- [[skill-retrieval|Skill 检索]] — 稠密/稀疏/生成/结构感知
- [[skill-selection|Skill 选择]] — 上下文/组合/效用/反馈
- [[skill-evolution|Skill 演化]] — 修订→验证→策略耦合→仓库演化→治理
- [[skill-composition|Skill 组合]] — 多技能编排与组装
- [[agent-skill-ecosystem|Agent Skill 生态]] — 平台与基础设施
- [[passive-vs-active-knowledge|被动 vs 主动知识]] — agent 知识二分类
- [[runtime-governance|运行时治理]] — 检索-信任-执行-退役闭环
来源:[原始存档](raw/papers/zhou-agent-skills-survey-2026.md)