4.4 KiB
4.4 KiB
title, created, updated, type, tags, sources
| title | created | updated | type | tags | sources | |||||||
|---|---|---|---|---|---|---|---|---|---|---|---|---|
| A Comprehensive Survey on Agent Skills — 综述 | 2026-06-19 | 2026-06-19 | paper |
|
|
Agent Skills 综述:分类、技术与应用
Yingli Zhou, Shu Wang, Yaodong Su, Wenchuan Du, Yixiang Fang, Xuemin Lin (CUHK-Shenzhen) · 2026 · arXiv:2605.07358
核心问题
LLM agent 在实际部署中面临一个核心瓶颈:过程性鸿沟(procedural gap)——仅靠工具访问(tool access)不等同于知道何时调用、如何编排、怎样验证。这篇综述以 agent skill 为中心视角,定义其为"可复用的过程性构件,在任务特定约束下协调工具、内存和运行时上下文"。
核心洞察
Agent 与 skill 是互补的层级关系:
- Agent 负责高层推理和规划("做什么")
- Skill 构成操作层,负责可靠、可复用、可组合的执行("怎么做")
Skill 可视为 agent 的"肌肉记忆"——将过程性 know-how 外化为可持久化、可检索、可修订的显式构件。
方法论框架
论文围绕 skill 生命周期的四个阶段组织文献:
1. Skill Representation(表示)
基于资源类型分类:
- 文本型(Text-Based):参考文档、模板、检查清单
- 代码型(Code-Backed):可执行脚本、包装器、API
- 混合型(Hybrid):文本 + 代码结合,兼顾可解释性和执行确定性
形式化定义:S = (M, R, C)——指令文档 + 辅助资源 + 适用条件。
2. Skill Acquisition(获取)
四种获取路径:
- 人工来源(Human-Derived):领域专家编写,精度高但扩展性差
- 经验来源(Experience-Derived):从执行轨迹中抽象(选择→摘要→记忆组织→过程打包),研究最活跃
- 任务来源(Task-Derived):按需构建,新任务无法等待专家或经验积累时使用
- 语料来源(Corpus-Derived):从文档、仓库、数据集、接口轨迹中提取
四种路径互补而非竞争——最强大的 skill 库来自它们的组合。
3. Skill Retrieval & Selection(检索与选择)
分为两阶段:
- 检索:稠密嵌入、稀疏关键词、生成式、结构感知(层级 + 依赖图)
- 选择:上下文感知、技能组合、成本/效用感知、反馈驱动重排序
关键洞察:skill 检索不同于文档检索——skill 是可执行单元,语义相关不等于可执行。必须考虑前置条件、组合兼容性、成本收益。
4. Skill Evolution(演化)
五个子阶段:
- Skill Revision:反馈驱动的技能修订
- Skill Validation:修订后的生存检查(测试、回滚)
- Policy Coupling:策略与技能库共同优化(如 SkillRL)
- Repository Evolution:跨 artifact 的规模化演化
- Runtime Governance:检索→路由→信任检查→执行→退役的安全闭环
代表性平台
| 平台 | 规模 |
|---|---|
| SkillNet | 300k+ |
| ClawHub | 40k+ |
| SkillHub | 80k+ |
| SkillsMP | 700k+ |
| Skills.sh | 90k+ |
与 Hermes 的关联
Hermes 的 skill 体系(SKILL.md + references/templates/scripts)天然覆盖了论文中定义的核心结构 (M, R, C)。论文列出的开放挑战——统一 skill schema、资源感知联合优化、因果诊断、生命周期鲁棒性——也是 Hermes skill 系统可以演进的方向。
关键概念
- agent-skill — 形式化定义与核心属性
- procedural-gap — 工具访问与鲁棒执行之间的桥梁
- skill-lifecycle — 四阶段框架
- skill-representation — 文本/代码/混合三种形态
- skill-acquisition — 四种获取路径
- skill-retrieval — 稠密/稀疏/生成/结构感知
- skill-selection — 上下文/组合/效用/反馈
- skill-evolution — 修订→验证→策略耦合→仓库演化→治理
- skill-composition — 多技能编排与组装
- agent-skill-ecosystem — 平台与基础设施
- passive-vs-active-knowledge — agent 知识二分类
- runtime-governance — 检索-信任-执行-退役闭环
来源:原始存档