2.4 KiB
2.4 KiB
title, created, updated, type, tags, sources
| title | created | updated | type | tags | sources | ||||
|---|---|---|---|---|---|---|---|---|---|
| Skill 检索 — 稠密/稀疏/生成/结构 | 2026-06-19 | 2026-06-19 | concept |
|
|
Skill 检索(Retrieval)
定义
Skill 检索是将大规模 skill 池缩减为可管理的候选集的过程。它是 skill 使用管线的第一阶段——检索决定候选召回,选择决定执行决策。
为什么不是普通文档检索?
Skill 是可执行单元——调用可能触发工具调用、工作流转换、外部副作用和非平凡成本。语义相关不等于可执行:必须满足前置条件、兼容性约束、成本收益权衡。
四种检索范式
1. 稠密嵌入检索(Dense Embedding)
- 将任务和 skill 映射到共享嵌入空间,按向量相似度检索
- 最通用,任务自然语言描述变化大时最有效
- 代表:Voyager, SAGE, AutoSkill, MemSkill
- 局限:最近邻在语义上 ≠ 最近邻在适用性上
2. 稀疏/关键词检索(Sparse/Keyword)
- 基于显式符号字段和元数据匹配
- 当库暴露稳定名称、接口字段、触发线索时更可信
- 通常用于锐化或过滤稠密检索的候选池
- 代表:SAGE (Query N-gram), SkillWeaver, Memento-Skills, SkillNet
3. 生成式检索(Generative)
- 模型在解码时直接生成目标 skill 标识符
- 消除候选召回与下游动作生成之间的边界
- 代价:难以在大型候选空间中保证覆盖和标识符有效性
- 代表:ToolGen, ToolLLM
4. 结构感知检索(Structure-Aware)
假设 skill 库有内部组织结构,不应视为平面池:
层级检索(Hierarchical):
- 粗到细逐步缩减搜索空间
- 代表:SkillRL, AgentSkillOS, TOOL-PLANNER, SkillNet, GraphSkill
依赖感知检索(Dependency-Aware):
- 排除违反前置条件、状态约束或组合要求的候选
- 代表:SkillWeaver (前置过滤), CUA-Skill, ToolExpNet
设计权衡
| 范式 | 灵活性 | 精度 | 覆盖率 | 执行感知 |
|---|---|---|---|---|
| 稠密 | 高 | 中 | 高 | 低 |
| 稀疏 | 低 | 高 | 中 | 中 |
| 生成 | 高 | 中 | 低 | 低 |
| 结构 | 中 | 高 | 高 | 高 |