67 lines
2.4 KiB
Markdown
67 lines
2.4 KiB
Markdown
---
|
||
title: "Skill 检索 — 稠密/稀疏/生成/结构"
|
||
created: 2026-06-19
|
||
updated: 2026-06-19
|
||
type: concept
|
||
tags: [agent-skills, retrieval, taxonomy]
|
||
sources:
|
||
- https://arxiv.org/abs/2605.07358
|
||
---
|
||
|
||
# Skill 检索(Retrieval)
|
||
|
||
## 定义
|
||
|
||
Skill 检索是将大规模 skill 池**缩减为可管理的候选集**的过程。它是 skill 使用管线的第一阶段——检索决定候选召回,选择决定执行决策。
|
||
|
||
## 为什么不是普通文档检索?
|
||
|
||
Skill 是**可执行单元**——调用可能触发工具调用、工作流转换、外部副作用和非平凡成本。语义相关不等于可执行:必须满足前置条件、兼容性约束、成本收益权衡。
|
||
|
||
## 四种检索范式
|
||
|
||
### 1. 稠密嵌入检索(Dense Embedding)
|
||
- 将任务和 skill 映射到共享嵌入空间,按向量相似度检索
|
||
- 最通用,任务自然语言描述变化大时最有效
|
||
- 代表:Voyager, SAGE, AutoSkill, MemSkill
|
||
- 局限:最近邻在语义上 ≠ 最近邻在适用性上
|
||
|
||
### 2. 稀疏/关键词检索(Sparse/Keyword)
|
||
- 基于显式符号字段和元数据匹配
|
||
- 当库暴露稳定名称、接口字段、触发线索时更可信
|
||
- 通常用于**锐化或过滤**稠密检索的候选池
|
||
- 代表:SAGE (Query N-gram), SkillWeaver, Memento-Skills, SkillNet
|
||
|
||
### 3. 生成式检索(Generative)
|
||
- 模型在解码时直接生成目标 skill 标识符
|
||
- 消除候选召回与下游动作生成之间的边界
|
||
- 代价:难以在大型候选空间中保证覆盖和标识符有效性
|
||
- 代表:ToolGen, ToolLLM
|
||
|
||
### 4. 结构感知检索(Structure-Aware)
|
||
假设 skill 库有内部组织结构,不应视为平面池:
|
||
|
||
**层级检索(Hierarchical)**:
|
||
- 粗到细逐步缩减搜索空间
|
||
- 代表:SkillRL, AgentSkillOS, TOOL-PLANNER, SkillNet, GraphSkill
|
||
|
||
**依赖感知检索(Dependency-Aware)**:
|
||
- 排除违反前置条件、状态约束或组合要求的候选
|
||
- 代表:SkillWeaver (前置过滤), CUA-Skill, ToolExpNet
|
||
|
||
## 设计权衡
|
||
|
||
| 范式 | 灵活性 | 精度 | 覆盖率 | 执行感知 |
|
||
|------|-------|------|-------|--------|
|
||
| 稠密 | 高 | 中 | 高 | 低 |
|
||
| 稀疏 | 低 | 高 | 中 | 中 |
|
||
| 生成 | 高 | 中 | 低 | 低 |
|
||
| 结构 | 中 | 高 | 高 | 高 |
|
||
|
||
## 参考
|
||
|
||
- [[zhou-agent-skills-survey-2026|Zhou et al. 2026]]
|
||
- [[skill-selection|Skill 选择]]
|
||
- [[skill-lifecycle|Skill 生命周期]]
|
||
- [[skill-representation|Skill 表示]]
|