20260625:很多新内容

2026-06-25 14:08:47 +08:00
parent 91fac5b6fc
commit 6021dea160
375 changed files with 19263 additions and 251 deletions
--- a/concepts/skill-selection.md
+++ b/concepts/skill-selection.md
@@ -0,0 +1,62 @@
+---
+title: "Skill 选择 — 上下文/组合/效用/反馈"
+created: 2026-06-19
+updated: 2026-06-19
+type: concept
+tags: [agent-skills, selection, decision-making]
+sources:
+  - https://arxiv.org/abs/2605.07358
+---
+
+# Skill 选择（Selection）
+
+## 定义
+
+Skill 选择是 skill 使用管线的**第二阶段**：从检索返回的候选集中决定最终调用哪个 skill、是否组合多个 skill、以及如何根据当前状态和预算做出决策。
+
+## 与检索的区别
+
+> 检索解决候选召回，选择解决执行导向的决策。
+
+| | 检索 (Retrieval) | 选择 (Selection) |
+|---|---|---|
+| 目标 | 从一个大的 skill 池中找到相关候选 | 决定最终调用哪个（或如何组合） |
+| 输入 | 任务描述、skill 元数据 | 候选集 + 当前状态 + 子目标 + 预算 |
+| 输出 | 候选集 | 执行决策 |
+
+## 四个选择视角
+
+### 1. 上下文感知动态选择（Context-Aware）
+- 将 skill 选择视为在线的、以当前观察、子目标和交互历史为条件的决策过程
+- 随执行展开修订选择，而非一次固定
+- 代表：AutoGuide, MemSkill, Memento-Skills
+
+### 2. Skill 组合（Composition）
+- 复杂任务需要**组装多个 skill** 为序列、集合或工作流
+- 核心问题不仅是"哪个 skill 相关"，更是"如何排序和连接"
+- 引入新失败模式：接口兼容性、顺序约束、错误传播
+- 代表：SkillWeaver, AWM, ASI, AgentSkillOS, CUA-Skill
+- → [[skill-composition|Skill 组合]]
+
+### 3. 成本/效用感知选择（Cost/Utility-Aware）
+- 不应仅偏好最相关的 skill，应考虑效用与成本/风险/副作用
+- Skill 可能有负效用——即使任务匹配，也不应调用
+- 这是**新兴设计准则**，尚未形成成熟的方法家族
+- 代表：MemSkill, Memento-Skills, SkillOrchestra, SkillsBench
+
+### 4. 反馈驱动重排序（Feedback-Driven）
+- 用历史执行信号更新 skill 偏好
+- 今天的错误应成为明天的排序信号
+- 通常作为**增强层**叠加在更广泛的选择管线上
+- 代表：SkillRL, CUA-Skill, ToolExpNet, ExpeL, SMART
+
+## 关键洞察
+
+Skill 选择本质上是**策略问题**而非排序问题。四个维度（上下文、组合、成本、反馈）互补而非互斥——实际系统往往同时结合多个维度。
+
+## 参考
+
+- [[zhou-agent-skills-survey-2026|Zhou et al. 2026]]
+- [[skill-retrieval|Skill 检索]]
+- [[skill-composition|Skill 组合]]
+- [[skill-evolution|Skill 演化]]