Files
myWiki/concepts/skill-retrieval.md

67 lines
2.4 KiB
Markdown
Raw Blame History

This file contains ambiguous Unicode characters

This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.

---
title: "Skill 检索 — 稠密/稀疏/生成/结构"
created: 2026-06-19
updated: 2026-06-19
type: concept
tags: [agent-skills, retrieval, taxonomy]
sources:
- https://arxiv.org/abs/2605.07358
---
# Skill 检索Retrieval
## 定义
Skill 检索是将大规模 skill 池**缩减为可管理的候选集**的过程。它是 skill 使用管线的第一阶段——检索决定候选召回,选择决定执行决策。
## 为什么不是普通文档检索?
Skill 是**可执行单元**——调用可能触发工具调用、工作流转换、外部副作用和非平凡成本。语义相关不等于可执行:必须满足前置条件、兼容性约束、成本收益权衡。
## 四种检索范式
### 1. 稠密嵌入检索Dense Embedding
- 将任务和 skill 映射到共享嵌入空间,按向量相似度检索
- 最通用,任务自然语言描述变化大时最有效
- 代表Voyager, SAGE, AutoSkill, MemSkill
- 局限:最近邻在语义上 ≠ 最近邻在适用性上
### 2. 稀疏/关键词检索Sparse/Keyword
- 基于显式符号字段和元数据匹配
- 当库暴露稳定名称、接口字段、触发线索时更可信
- 通常用于**锐化或过滤**稠密检索的候选池
- 代表SAGE (Query N-gram), SkillWeaver, Memento-Skills, SkillNet
### 3. 生成式检索Generative
- 模型在解码时直接生成目标 skill 标识符
- 消除候选召回与下游动作生成之间的边界
- 代价:难以在大型候选空间中保证覆盖和标识符有效性
- 代表ToolGen, ToolLLM
### 4. 结构感知检索Structure-Aware
假设 skill 库有内部组织结构,不应视为平面池:
**层级检索Hierarchical**
- 粗到细逐步缩减搜索空间
- 代表SkillRL, AgentSkillOS, TOOL-PLANNER, SkillNet, GraphSkill
**依赖感知检索Dependency-Aware**
- 排除违反前置条件、状态约束或组合要求的候选
- 代表SkillWeaver (前置过滤), CUA-Skill, ToolExpNet
## 设计权衡
| 范式 | 灵活性 | 精度 | 覆盖率 | 执行感知 |
|------|-------|------|-------|--------|
| 稠密 | 高 | 中 | 高 | 低 |
| 稀疏 | 低 | 高 | 中 | 中 |
| 生成 | 高 | 中 | 低 | 低 |
| 结构 | 中 | 高 | 高 | 高 |
## 参考
- [[zhou-agent-skills-survey-2026|Zhou et al. 2026]]
- [[skill-selection|Skill 选择]]
- [[skill-lifecycle|Skill 生命周期]]
- [[skill-representation|Skill 表示]]