--- title: "Skill 选择 — 上下文/组合/效用/反馈" created: 2026-06-19 updated: 2026-06-19 type: concept tags: [agent-skills, selection, decision-making] sources: - https://arxiv.org/abs/2605.07358 --- # Skill 选择(Selection) ## 定义 Skill 选择是 skill 使用管线的**第二阶段**:从检索返回的候选集中决定最终调用哪个 skill、是否组合多个 skill、以及如何根据当前状态和预算做出决策。 ## 与检索的区别 > 检索解决候选召回,选择解决执行导向的决策。 | | 检索 (Retrieval) | 选择 (Selection) | |---|---|---| | 目标 | 从一个大的 skill 池中找到相关候选 | 决定最终调用哪个(或如何组合) | | 输入 | 任务描述、skill 元数据 | 候选集 + 当前状态 + 子目标 + 预算 | | 输出 | 候选集 | 执行决策 | ## 四个选择视角 ### 1. 上下文感知动态选择(Context-Aware) - 将 skill 选择视为在线的、以当前观察、子目标和交互历史为条件的决策过程 - 随执行展开修订选择,而非一次固定 - 代表:AutoGuide, MemSkill, Memento-Skills ### 2. Skill 组合(Composition) - 复杂任务需要**组装多个 skill** 为序列、集合或工作流 - 核心问题不仅是"哪个 skill 相关",更是"如何排序和连接" - 引入新失败模式:接口兼容性、顺序约束、错误传播 - 代表:SkillWeaver, AWM, ASI, AgentSkillOS, CUA-Skill - → [[skill-composition|Skill 组合]] ### 3. 成本/效用感知选择(Cost/Utility-Aware) - 不应仅偏好最相关的 skill,应考虑效用与成本/风险/副作用 - Skill 可能有负效用——即使任务匹配,也不应调用 - 这是**新兴设计准则**,尚未形成成熟的方法家族 - 代表:MemSkill, Memento-Skills, SkillOrchestra, SkillsBench ### 4. 反馈驱动重排序(Feedback-Driven) - 用历史执行信号更新 skill 偏好 - 今天的错误应成为明天的排序信号 - 通常作为**增强层**叠加在更广泛的选择管线上 - 代表:SkillRL, CUA-Skill, ToolExpNet, ExpeL, SMART ## 关键洞察 Skill 选择本质上是**策略问题**而非排序问题。四个维度(上下文、组合、成本、反馈)互补而非互斥——实际系统往往同时结合多个维度。 ## 参考 - [[zhou-agent-skills-survey-2026|Zhou et al. 2026]] - [[skill-retrieval|Skill 检索]] - [[skill-composition|Skill 组合]] - [[skill-evolution|Skill 演化]]