94 lines
4.4 KiB
Markdown
94 lines
4.4 KiB
Markdown
---
|
||
title: "A Comprehensive Survey on Agent Skills — 综述"
|
||
created: 2026-06-19
|
||
updated: 2026-06-19
|
||
type: paper
|
||
tags: [agent-skills, survey, skill-lifecycle, llm-agents, procedural-knowledge]
|
||
sources:
|
||
- https://arxiv.org/abs/2605.07358
|
||
- https://github.com/JayLZhou/Awesome-Agent-Skills
|
||
---
|
||
|
||
# Agent Skills 综述:分类、技术与应用
|
||
|
||
> **Yingli Zhou, Shu Wang, Yaodong Su, Wenchuan Du, Yixiang Fang, Xuemin Lin** (CUHK-Shenzhen) · 2026 · arXiv:2605.07358
|
||
|
||
## 核心问题
|
||
|
||
LLM agent 在实际部署中面临一个核心瓶颈:**过程性鸿沟(procedural gap)**——仅靠工具访问(tool access)不等同于知道何时调用、如何编排、怎样验证。这篇综述以 **agent skill** 为中心视角,定义其为"可复用的过程性构件,在任务特定约束下协调工具、内存和运行时上下文"。
|
||
|
||
## 核心洞察
|
||
|
||
Agent 与 skill 是互补的层级关系:
|
||
- **Agent** 负责高层推理和规划("做什么")
|
||
- **Skill** 构成操作层,负责可靠、可复用、可组合的执行("怎么做")
|
||
|
||
Skill 可视为 agent 的"肌肉记忆"——将过程性 know-how 外化为可持久化、可检索、可修订的显式构件。
|
||
|
||
## 方法论框架
|
||
|
||
论文围绕 skill 生命周期的四个阶段组织文献:
|
||
|
||
### 1. Skill Representation(表示)
|
||
基于资源类型分类:
|
||
- **文本型(Text-Based)**:参考文档、模板、检查清单
|
||
- **代码型(Code-Backed)**:可执行脚本、包装器、API
|
||
- **混合型(Hybrid)**:文本 + 代码结合,兼顾可解释性和执行确定性
|
||
|
||
形式化定义:**S = (M, R, C)**——指令文档 + 辅助资源 + 适用条件。
|
||
|
||
### 2. Skill Acquisition(获取)
|
||
四种获取路径:
|
||
- **人工来源(Human-Derived)**:领域专家编写,精度高但扩展性差
|
||
- **经验来源(Experience-Derived)**:从执行轨迹中抽象(选择→摘要→记忆组织→过程打包),研究最活跃
|
||
- **任务来源(Task-Derived)**:按需构建,新任务无法等待专家或经验积累时使用
|
||
- **语料来源(Corpus-Derived)**:从文档、仓库、数据集、接口轨迹中提取
|
||
|
||
四种路径互补而非竞争——最强大的 skill 库来自它们的组合。
|
||
|
||
### 3. Skill Retrieval & Selection(检索与选择)
|
||
分为两阶段:
|
||
- **检索**:稠密嵌入、稀疏关键词、生成式、结构感知(层级 + 依赖图)
|
||
- **选择**:上下文感知、技能组合、成本/效用感知、反馈驱动重排序
|
||
|
||
关键洞察:skill 检索不同于文档检索——skill 是可执行单元,语义相关不等于可执行。必须考虑前置条件、组合兼容性、成本收益。
|
||
|
||
### 4. Skill Evolution(演化)
|
||
五个子阶段:
|
||
- **Skill Revision**:反馈驱动的技能修订
|
||
- **Skill Validation**:修订后的生存检查(测试、回滚)
|
||
- **Policy Coupling**:策略与技能库共同优化(如 SkillRL)
|
||
- **Repository Evolution**:跨 artifact 的规模化演化
|
||
- **Runtime Governance**:检索→路由→信任检查→执行→退役的安全闭环
|
||
|
||
## 代表性平台
|
||
|
||
| 平台 | 规模 |
|
||
|------|------|
|
||
| SkillNet | 300k+ |
|
||
| ClawHub | 40k+ |
|
||
| SkillHub | 80k+ |
|
||
| SkillsMP | 700k+ |
|
||
| Skills.sh | 90k+ |
|
||
|
||
## 与 Hermes 的关联
|
||
|
||
Hermes 的 skill 体系(SKILL.md + references/templates/scripts)天然覆盖了论文中定义的核心结构 (M, R, C)。论文列出的开放挑战——统一 skill schema、资源感知联合优化、因果诊断、生命周期鲁棒性——也是 Hermes skill 系统可以演进的方向。
|
||
|
||
## 关键概念
|
||
|
||
- [[agent-skill|Agent Skill]] — 形式化定义与核心属性
|
||
- [[procedural-gap|过程性鸿沟]] — 工具访问与鲁棒执行之间的桥梁
|
||
- [[skill-lifecycle|Skill 生命周期]] — 四阶段框架
|
||
- [[skill-representation|Skill 表示]] — 文本/代码/混合三种形态
|
||
- [[skill-acquisition|Skill 获取]] — 四种获取路径
|
||
- [[skill-retrieval|Skill 检索]] — 稠密/稀疏/生成/结构感知
|
||
- [[skill-selection|Skill 选择]] — 上下文/组合/效用/反馈
|
||
- [[skill-evolution|Skill 演化]] — 修订→验证→策略耦合→仓库演化→治理
|
||
- [[skill-composition|Skill 组合]] — 多技能编排与组装
|
||
- [[agent-skill-ecosystem|Agent Skill 生态]] — 平台与基础设施
|
||
- [[passive-vs-active-knowledge|被动 vs 主动知识]] — agent 知识二分类
|
||
- [[runtime-governance|运行时治理]] — 检索-信任-执行-退役闭环
|
||
|
||
来源:[原始存档](raw/papers/zhou-agent-skills-survey-2026.md)
|