20260625:很多新内容
This commit is contained in:
93
papers/zhou-agent-skills-survey-2026.md
Normal file
93
papers/zhou-agent-skills-survey-2026.md
Normal file
@@ -0,0 +1,93 @@
|
||||
---
|
||||
title: "A Comprehensive Survey on Agent Skills — 综述"
|
||||
created: 2026-06-19
|
||||
updated: 2026-06-19
|
||||
type: paper
|
||||
tags: [agent-skills, survey, skill-lifecycle, llm-agents, procedural-knowledge]
|
||||
sources:
|
||||
- https://arxiv.org/abs/2605.07358
|
||||
- https://github.com/JayLZhou/Awesome-Agent-Skills
|
||||
---
|
||||
|
||||
# Agent Skills 综述:分类、技术与应用
|
||||
|
||||
> **Yingli Zhou, Shu Wang, Yaodong Su, Wenchuan Du, Yixiang Fang, Xuemin Lin** (CUHK-Shenzhen) · 2026 · arXiv:2605.07358
|
||||
|
||||
## 核心问题
|
||||
|
||||
LLM agent 在实际部署中面临一个核心瓶颈:**过程性鸿沟(procedural gap)**——仅靠工具访问(tool access)不等同于知道何时调用、如何编排、怎样验证。这篇综述以 **agent skill** 为中心视角,定义其为"可复用的过程性构件,在任务特定约束下协调工具、内存和运行时上下文"。
|
||||
|
||||
## 核心洞察
|
||||
|
||||
Agent 与 skill 是互补的层级关系:
|
||||
- **Agent** 负责高层推理和规划("做什么")
|
||||
- **Skill** 构成操作层,负责可靠、可复用、可组合的执行("怎么做")
|
||||
|
||||
Skill 可视为 agent 的"肌肉记忆"——将过程性 know-how 外化为可持久化、可检索、可修订的显式构件。
|
||||
|
||||
## 方法论框架
|
||||
|
||||
论文围绕 skill 生命周期的四个阶段组织文献:
|
||||
|
||||
### 1. Skill Representation(表示)
|
||||
基于资源类型分类:
|
||||
- **文本型(Text-Based)**:参考文档、模板、检查清单
|
||||
- **代码型(Code-Backed)**:可执行脚本、包装器、API
|
||||
- **混合型(Hybrid)**:文本 + 代码结合,兼顾可解释性和执行确定性
|
||||
|
||||
形式化定义:**S = (M, R, C)**——指令文档 + 辅助资源 + 适用条件。
|
||||
|
||||
### 2. Skill Acquisition(获取)
|
||||
四种获取路径:
|
||||
- **人工来源(Human-Derived)**:领域专家编写,精度高但扩展性差
|
||||
- **经验来源(Experience-Derived)**:从执行轨迹中抽象(选择→摘要→记忆组织→过程打包),研究最活跃
|
||||
- **任务来源(Task-Derived)**:按需构建,新任务无法等待专家或经验积累时使用
|
||||
- **语料来源(Corpus-Derived)**:从文档、仓库、数据集、接口轨迹中提取
|
||||
|
||||
四种路径互补而非竞争——最强大的 skill 库来自它们的组合。
|
||||
|
||||
### 3. Skill Retrieval & Selection(检索与选择)
|
||||
分为两阶段:
|
||||
- **检索**:稠密嵌入、稀疏关键词、生成式、结构感知(层级 + 依赖图)
|
||||
- **选择**:上下文感知、技能组合、成本/效用感知、反馈驱动重排序
|
||||
|
||||
关键洞察:skill 检索不同于文档检索——skill 是可执行单元,语义相关不等于可执行。必须考虑前置条件、组合兼容性、成本收益。
|
||||
|
||||
### 4. Skill Evolution(演化)
|
||||
五个子阶段:
|
||||
- **Skill Revision**:反馈驱动的技能修订
|
||||
- **Skill Validation**:修订后的生存检查(测试、回滚)
|
||||
- **Policy Coupling**:策略与技能库共同优化(如 SkillRL)
|
||||
- **Repository Evolution**:跨 artifact 的规模化演化
|
||||
- **Runtime Governance**:检索→路由→信任检查→执行→退役的安全闭环
|
||||
|
||||
## 代表性平台
|
||||
|
||||
| 平台 | 规模 |
|
||||
|------|------|
|
||||
| SkillNet | 300k+ |
|
||||
| ClawHub | 40k+ |
|
||||
| SkillHub | 80k+ |
|
||||
| SkillsMP | 700k+ |
|
||||
| Skills.sh | 90k+ |
|
||||
|
||||
## 与 Hermes 的关联
|
||||
|
||||
Hermes 的 skill 体系(SKILL.md + references/templates/scripts)天然覆盖了论文中定义的核心结构 (M, R, C)。论文列出的开放挑战——统一 skill schema、资源感知联合优化、因果诊断、生命周期鲁棒性——也是 Hermes skill 系统可以演进的方向。
|
||||
|
||||
## 关键概念
|
||||
|
||||
- [[agent-skill|Agent Skill]] — 形式化定义与核心属性
|
||||
- [[procedural-gap|过程性鸿沟]] — 工具访问与鲁棒执行之间的桥梁
|
||||
- [[skill-lifecycle|Skill 生命周期]] — 四阶段框架
|
||||
- [[skill-representation|Skill 表示]] — 文本/代码/混合三种形态
|
||||
- [[skill-acquisition|Skill 获取]] — 四种获取路径
|
||||
- [[skill-retrieval|Skill 检索]] — 稠密/稀疏/生成/结构感知
|
||||
- [[skill-selection|Skill 选择]] — 上下文/组合/效用/反馈
|
||||
- [[skill-evolution|Skill 演化]] — 修订→验证→策略耦合→仓库演化→治理
|
||||
- [[skill-composition|Skill 组合]] — 多技能编排与组装
|
||||
- [[agent-skill-ecosystem|Agent Skill 生态]] — 平台与基础设施
|
||||
- [[passive-vs-active-knowledge|被动 vs 主动知识]] — agent 知识二分类
|
||||
- [[runtime-governance|运行时治理]] — 检索-信任-执行-退役闭环
|
||||
|
||||
来源:[原始存档](raw/papers/zhou-agent-skills-survey-2026.md)
|
||||
Reference in New Issue
Block a user