Files
myWiki/concepts/skill-retrieval.md

2.4 KiB
Raw Blame History

title, created, updated, type, tags, sources
title created updated type tags sources
Skill 检索 — 稠密/稀疏/生成/结构 2026-06-19 2026-06-19 concept
agent-skills
retrieval
taxonomy
https://arxiv.org/abs/2605.07358

Skill 检索Retrieval

定义

Skill 检索是将大规模 skill 池缩减为可管理的候选集的过程。它是 skill 使用管线的第一阶段——检索决定候选召回,选择决定执行决策。

为什么不是普通文档检索?

Skill 是可执行单元——调用可能触发工具调用、工作流转换、外部副作用和非平凡成本。语义相关不等于可执行:必须满足前置条件、兼容性约束、成本收益权衡。

四种检索范式

1. 稠密嵌入检索Dense Embedding

  • 将任务和 skill 映射到共享嵌入空间,按向量相似度检索
  • 最通用,任务自然语言描述变化大时最有效
  • 代表Voyager, SAGE, AutoSkill, MemSkill
  • 局限:最近邻在语义上 ≠ 最近邻在适用性上

2. 稀疏/关键词检索Sparse/Keyword

  • 基于显式符号字段和元数据匹配
  • 当库暴露稳定名称、接口字段、触发线索时更可信
  • 通常用于锐化或过滤稠密检索的候选池
  • 代表SAGE (Query N-gram), SkillWeaver, Memento-Skills, SkillNet

3. 生成式检索Generative

  • 模型在解码时直接生成目标 skill 标识符
  • 消除候选召回与下游动作生成之间的边界
  • 代价:难以在大型候选空间中保证覆盖和标识符有效性
  • 代表ToolGen, ToolLLM

4. 结构感知检索Structure-Aware

假设 skill 库有内部组织结构,不应视为平面池:

层级检索Hierarchical

  • 粗到细逐步缩减搜索空间
  • 代表SkillRL, AgentSkillOS, TOOL-PLANNER, SkillNet, GraphSkill

依赖感知检索Dependency-Aware

  • 排除违反前置条件、状态约束或组合要求的候选
  • 代表SkillWeaver (前置过滤), CUA-Skill, ToolExpNet

设计权衡

范式 灵活性 精度 覆盖率 执行感知
稠密
稀疏
生成
结构

参考