Files
myWiki/concepts/skill-selection.md

63 lines
2.4 KiB
Markdown
Raw Blame History

This file contains ambiguous Unicode characters

This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.

---
title: "Skill 选择 — 上下文/组合/效用/反馈"
created: 2026-06-19
updated: 2026-06-19
type: concept
tags: [agent-skills, selection, decision-making]
sources:
- https://arxiv.org/abs/2605.07358
---
# Skill 选择Selection
## 定义
Skill 选择是 skill 使用管线的**第二阶段**:从检索返回的候选集中决定最终调用哪个 skill、是否组合多个 skill、以及如何根据当前状态和预算做出决策。
## 与检索的区别
> 检索解决候选召回,选择解决执行导向的决策。
| | 检索 (Retrieval) | 选择 (Selection) |
|---|---|---|
| 目标 | 从一个大的 skill 池中找到相关候选 | 决定最终调用哪个(或如何组合) |
| 输入 | 任务描述、skill 元数据 | 候选集 + 当前状态 + 子目标 + 预算 |
| 输出 | 候选集 | 执行决策 |
## 四个选择视角
### 1. 上下文感知动态选择Context-Aware
- 将 skill 选择视为在线的、以当前观察、子目标和交互历史为条件的决策过程
- 随执行展开修订选择,而非一次固定
- 代表AutoGuide, MemSkill, Memento-Skills
### 2. Skill 组合Composition
- 复杂任务需要**组装多个 skill** 为序列、集合或工作流
- 核心问题不仅是"哪个 skill 相关",更是"如何排序和连接"
- 引入新失败模式:接口兼容性、顺序约束、错误传播
- 代表SkillWeaver, AWM, ASI, AgentSkillOS, CUA-Skill
- → [[skill-composition|Skill 组合]]
### 3. 成本/效用感知选择Cost/Utility-Aware
- 不应仅偏好最相关的 skill应考虑效用与成本/风险/副作用
- Skill 可能有负效用——即使任务匹配,也不应调用
- 这是**新兴设计准则**,尚未形成成熟的方法家族
- 代表MemSkill, Memento-Skills, SkillOrchestra, SkillsBench
### 4. 反馈驱动重排序Feedback-Driven
- 用历史执行信号更新 skill 偏好
- 今天的错误应成为明天的排序信号
- 通常作为**增强层**叠加在更广泛的选择管线上
- 代表SkillRL, CUA-Skill, ToolExpNet, ExpeL, SMART
## 关键洞察
Skill 选择本质上是**策略问题**而非排序问题。四个维度(上下文、组合、成本、反馈)互补而非互斥——实际系统往往同时结合多个维度。
## 参考
- [[zhou-agent-skills-survey-2026|Zhou et al. 2026]]
- [[skill-retrieval|Skill 检索]]
- [[skill-composition|Skill 组合]]
- [[skill-evolution|Skill 演化]]