Files
myWiki/papers/zhou-agent-skills-survey-2026.md

4.4 KiB
Raw Blame History

title, created, updated, type, tags, sources
title created updated type tags sources
A Comprehensive Survey on Agent Skills — 综述 2026-06-19 2026-06-19 paper
agent-skills
survey
skill-lifecycle
llm-agents
procedural-knowledge
https://arxiv.org/abs/2605.07358
https://github.com/JayLZhou/Awesome-Agent-Skills

Agent Skills 综述:分类、技术与应用

Yingli Zhou, Shu Wang, Yaodong Su, Wenchuan Du, Yixiang Fang, Xuemin Lin (CUHK-Shenzhen) · 2026 · arXiv:2605.07358

核心问题

LLM agent 在实际部署中面临一个核心瓶颈:过程性鸿沟procedural gap——仅靠工具访问tool access不等同于知道何时调用、如何编排、怎样验证。这篇综述以 agent skill 为中心视角,定义其为"可复用的过程性构件,在任务特定约束下协调工具、内存和运行时上下文"。

核心洞察

Agent 与 skill 是互补的层级关系:

  • Agent 负责高层推理和规划("做什么"
  • Skill 构成操作层,负责可靠、可复用、可组合的执行("怎么做"

Skill 可视为 agent 的"肌肉记忆"——将过程性 know-how 外化为可持久化、可检索、可修订的显式构件。

方法论框架

论文围绕 skill 生命周期的四个阶段组织文献:

1. Skill Representation表示

基于资源类型分类:

  • 文本型Text-Based:参考文档、模板、检查清单
  • 代码型Code-Backed可执行脚本、包装器、API
  • 混合型Hybrid:文本 + 代码结合,兼顾可解释性和执行确定性

形式化定义:S = (M, R, C)——指令文档 + 辅助资源 + 适用条件。

2. Skill Acquisition获取

四种获取路径:

  • 人工来源Human-Derived:领域专家编写,精度高但扩展性差
  • 经验来源Experience-Derived:从执行轨迹中抽象(选择→摘要→记忆组织→过程打包),研究最活跃
  • 任务来源Task-Derived:按需构建,新任务无法等待专家或经验积累时使用
  • 语料来源Corpus-Derived:从文档、仓库、数据集、接口轨迹中提取

四种路径互补而非竞争——最强大的 skill 库来自它们的组合。

3. Skill Retrieval & Selection检索与选择

分为两阶段:

  • 检索:稠密嵌入、稀疏关键词、生成式、结构感知(层级 + 依赖图)
  • 选择:上下文感知、技能组合、成本/效用感知、反馈驱动重排序

关键洞察skill 检索不同于文档检索——skill 是可执行单元,语义相关不等于可执行。必须考虑前置条件、组合兼容性、成本收益。

4. Skill Evolution演化

五个子阶段:

  • Skill Revision:反馈驱动的技能修订
  • Skill Validation:修订后的生存检查(测试、回滚)
  • Policy Coupling:策略与技能库共同优化(如 SkillRL
  • Repository Evolution:跨 artifact 的规模化演化
  • Runtime Governance:检索→路由→信任检查→执行→退役的安全闭环

代表性平台

平台 规模
SkillNet 300k+
ClawHub 40k+
SkillHub 80k+
SkillsMP 700k+
Skills.sh 90k+

与 Hermes 的关联

Hermes 的 skill 体系SKILL.md + references/templates/scripts天然覆盖了论文中定义的核心结构 (M, R, C)。论文列出的开放挑战——统一 skill schema、资源感知联合优化、因果诊断、生命周期鲁棒性——也是 Hermes skill 系统可以演进的方向。

关键概念

来源:原始存档