SidneyZhang/myWiki

Fork 0

Files

Sidney Zhang 6021dea160

20260625:很多新内容

2026-06-25 14:08:47 +08:00

4.4 KiB

Raw Blame History

title, created, updated, type, tags, sources

title

created

updated

type

Agent Skills 综述：分类、技术与应用

Yingli Zhou, Shu Wang, Yaodong Su, Wenchuan Du, Yixiang Fang, Xuemin Lin (CUHK-Shenzhen) · 2026 · arXiv:2605.07358

核心问题

LLM agent 在实际部署中面临一个核心瓶颈：过程性鸿沟（procedural gap）——仅靠工具访问（tool access）不等同于知道何时调用、如何编排、怎样验证。这篇综述以 agent skill 为中心视角，定义其为"可复用的过程性构件，在任务特定约束下协调工具、内存和运行时上下文"。

核心洞察

Agent 与 skill 是互补的层级关系：

Agent 负责高层推理和规划（"做什么"）
Skill 构成操作层，负责可靠、可复用、可组合的执行（"怎么做"）

Skill 可视为 agent 的"肌肉记忆"——将过程性 know-how 外化为可持久化、可检索、可修订的显式构件。

方法论框架

论文围绕 skill 生命周期的四个阶段组织文献：

1. Skill Representation（表示）

基于资源类型分类：

文本型（Text-Based）：参考文档、模板、检查清单
代码型（Code-Backed）：可执行脚本、包装器、API
混合型（Hybrid）：文本 + 代码结合，兼顾可解释性和执行确定性

形式化定义：S = (M, R, C)——指令文档 + 辅助资源 + 适用条件。

2. Skill Acquisition（获取）

四种获取路径：

人工来源（Human-Derived）：领域专家编写，精度高但扩展性差
经验来源（Experience-Derived）：从执行轨迹中抽象（选择→摘要→记忆组织→过程打包），研究最活跃
任务来源（Task-Derived）：按需构建，新任务无法等待专家或经验积累时使用
语料来源（Corpus-Derived）：从文档、仓库、数据集、接口轨迹中提取

四种路径互补而非竞争——最强大的 skill 库来自它们的组合。

3. Skill Retrieval & Selection（检索与选择）

分为两阶段：

检索：稠密嵌入、稀疏关键词、生成式、结构感知（层级 + 依赖图）
选择：上下文感知、技能组合、成本/效用感知、反馈驱动重排序

关键洞察：skill 检索不同于文档检索——skill 是可执行单元，语义相关不等于可执行。必须考虑前置条件、组合兼容性、成本收益。

4. Skill Evolution（演化）

五个子阶段：

Skill Revision：反馈驱动的技能修订
Skill Validation：修订后的生存检查（测试、回滚）
Policy Coupling：策略与技能库共同优化（如 SkillRL）
Repository Evolution：跨 artifact 的规模化演化
Runtime Governance：检索→路由→信任检查→执行→退役的安全闭环

代表性平台

平台	规模
SkillNet	300k+
ClawHub	40k+
SkillHub	80k+
SkillsMP	700k+
Skills.sh	90k+

与 Hermes 的关联

Hermes 的 skill 体系（SKILL.md + references/templates/scripts）天然覆盖了论文中定义的核心结构 (M, R, C)。论文列出的开放挑战——统一 skill schema、资源感知联合优化、因果诊断、生命周期鲁棒性——也是 Hermes skill 系统可以演进的方向。

关键概念

agent-skill — 形式化定义与核心属性
procedural-gap — 工具访问与鲁棒执行之间的桥梁
skill-lifecycle — 四阶段框架
skill-representation — 文本/代码/混合三种形态
skill-acquisition — 四种获取路径
skill-retrieval — 稠密/稀疏/生成/结构感知
skill-selection — 上下文/组合/效用/反馈
skill-evolution — 修订→验证→策略耦合→仓库演化→治理
skill-composition — 多技能编排与组装
agent-skill-ecosystem — 平台与基础设施
passive-vs-active-knowledge — agent 知识二分类
runtime-governance — 检索-信任-执行-退役闭环

来源：原始存档

4.4 KiB Raw Blame History Unescape Escape