--- title: "Skill 检索 — 稠密/稀疏/生成/结构" created: 2026-06-19 updated: 2026-06-19 type: concept tags: [agent-skills, retrieval, taxonomy] sources: - https://arxiv.org/abs/2605.07358 --- # Skill 检索(Retrieval) ## 定义 Skill 检索是将大规模 skill 池**缩减为可管理的候选集**的过程。它是 skill 使用管线的第一阶段——检索决定候选召回,选择决定执行决策。 ## 为什么不是普通文档检索? Skill 是**可执行单元**——调用可能触发工具调用、工作流转换、外部副作用和非平凡成本。语义相关不等于可执行:必须满足前置条件、兼容性约束、成本收益权衡。 ## 四种检索范式 ### 1. 稠密嵌入检索(Dense Embedding) - 将任务和 skill 映射到共享嵌入空间,按向量相似度检索 - 最通用,任务自然语言描述变化大时最有效 - 代表:Voyager, SAGE, AutoSkill, MemSkill - 局限:最近邻在语义上 ≠ 最近邻在适用性上 ### 2. 稀疏/关键词检索(Sparse/Keyword) - 基于显式符号字段和元数据匹配 - 当库暴露稳定名称、接口字段、触发线索时更可信 - 通常用于**锐化或过滤**稠密检索的候选池 - 代表:SAGE (Query N-gram), SkillWeaver, Memento-Skills, SkillNet ### 3. 生成式检索(Generative) - 模型在解码时直接生成目标 skill 标识符 - 消除候选召回与下游动作生成之间的边界 - 代价:难以在大型候选空间中保证覆盖和标识符有效性 - 代表:ToolGen, ToolLLM ### 4. 结构感知检索(Structure-Aware) 假设 skill 库有内部组织结构,不应视为平面池: **层级检索(Hierarchical)**: - 粗到细逐步缩减搜索空间 - 代表:SkillRL, AgentSkillOS, TOOL-PLANNER, SkillNet, GraphSkill **依赖感知检索(Dependency-Aware)**: - 排除违反前置条件、状态约束或组合要求的候选 - 代表:SkillWeaver (前置过滤), CUA-Skill, ToolExpNet ## 设计权衡 | 范式 | 灵活性 | 精度 | 覆盖率 | 执行感知 | |------|-------|------|-------|--------| | 稠密 | 高 | 中 | 高 | 低 | | 稀疏 | 低 | 高 | 中 | 中 | | 生成 | 高 | 中 | 低 | 低 | | 结构 | 中 | 高 | 高 | 高 | ## 参考 - [[zhou-agent-skills-survey-2026|Zhou et al. 2026]] - [[skill-selection|Skill 选择]] - [[skill-lifecycle|Skill 生命周期]] - [[skill-representation|Skill 表示]]