myWiki/concepts/skill-retrieval.md

---
title: "Skill 检索 — 稠密/稀疏/生成/结构"
created: 2026-06-19
updated: 2026-06-19
type: concept
tags: [agent-skills, retrieval, taxonomy]
sources:
  - https://arxiv.org/abs/2605.07358
---

# Skill 检索（Retrieval）

## 定义

Skill 检索是将大规模 skill 池**缩减为可管理的候选集**的过程。它是 skill 使用管线的第一阶段——检索决定候选召回，选择决定执行决策。

## 为什么不是普通文档检索？

Skill 是**可执行单元**——调用可能触发工具调用、工作流转换、外部副作用和非平凡成本。语义相关不等于可执行：必须满足前置条件、兼容性约束、成本收益权衡。

## 四种检索范式

### 1. 稠密嵌入检索（Dense Embedding）
- 将任务和 skill 映射到共享嵌入空间，按向量相似度检索
- 最通用，任务自然语言描述变化大时最有效
- 代表：Voyager, SAGE, AutoSkill, MemSkill
- 局限：最近邻在语义上 ≠ 最近邻在适用性上

### 2. 稀疏/关键词检索（Sparse/Keyword）
- 基于显式符号字段和元数据匹配
- 当库暴露稳定名称、接口字段、触发线索时更可信
- 通常用于**锐化或过滤**稠密检索的候选池
- 代表：SAGE (Query N-gram), SkillWeaver, Memento-Skills, SkillNet

### 3. 生成式检索（Generative）
- 模型在解码时直接生成目标 skill 标识符
- 消除候选召回与下游动作生成之间的边界
- 代价：难以在大型候选空间中保证覆盖和标识符有效性
- 代表：ToolGen, ToolLLM

### 4. 结构感知检索（Structure-Aware）
假设 skill 库有内部组织结构，不应视为平面池：

**层级检索（Hierarchical）**：
- 粗到细逐步缩减搜索空间
- 代表：SkillRL, AgentSkillOS, TOOL-PLANNER, SkillNet, GraphSkill

**依赖感知检索（Dependency-Aware）**：
- 排除违反前置条件、状态约束或组合要求的候选
- 代表：SkillWeaver (前置过滤), CUA-Skill, ToolExpNet

## 设计权衡

| 范式 | 灵活性 | 精度 | 覆盖率 | 执行感知 |
|------|-------|------|-------|--------|
| 稠密 | 高 | 中 | 高 | 低 |
| 稀疏 | 低 | 高 | 中 | 中 |
| 生成 | 高 | 中 | 低 | 低 |
| 结构 | 中 | 高 | 高 | 高 |

## 参考

- [[zhou-agent-skills-survey-2026|Zhou et al. 2026]]
- [[skill-selection|Skill 选择]]
- [[skill-lifecycle|Skill 生命周期]]
- [[skill-representation|Skill 表示]]