SidneyZhang/myWiki

Files

Sidney Zhang 6021dea160

20260625:很多新内容

2026-06-25 14:08:47 +08:00

2.4 KiB

Raw Blame History

title, created, updated, type, tags, sources

title

created

updated

type

tags

sources

Skill 选择 — 上下文/组合/效用/反馈

2026-06-19

2026-06-19

concept

agent-skills

selection

decision-making

https://arxiv.org/abs/2605.07358

Skill 选择（Selection）

定义

Skill 选择是 skill 使用管线的第二阶段：从检索返回的候选集中决定最终调用哪个 skill、是否组合多个 skill、以及如何根据当前状态和预算做出决策。

与检索的区别

检索解决候选召回，选择解决执行导向的决策。

	检索 (Retrieval)	选择 (Selection)
目标	从一个大的 skill 池中找到相关候选	决定最终调用哪个（或如何组合）
输入	任务描述、skill 元数据	候选集 + 当前状态 + 子目标 + 预算
输出	候选集	执行决策

四个选择视角

1. 上下文感知动态选择（Context-Aware）

将 skill 选择视为在线的、以当前观察、子目标和交互历史为条件的决策过程
随执行展开修订选择，而非一次固定
代表：AutoGuide, MemSkill, Memento-Skills

2. Skill 组合（Composition）

复杂任务需要组装多个 skill 为序列、集合或工作流
核心问题不仅是"哪个 skill 相关"，更是"如何排序和连接"
引入新失败模式：接口兼容性、顺序约束、错误传播
代表：SkillWeaver, AWM, ASI, AgentSkillOS, CUA-Skill
→ skill-composition

3. 成本/效用感知选择（Cost/Utility-Aware）

不应仅偏好最相关的 skill，应考虑效用与成本/风险/副作用
Skill 可能有负效用——即使任务匹配，也不应调用
这是新兴设计准则，尚未形成成熟的方法家族
代表：MemSkill, Memento-Skills, SkillOrchestra, SkillsBench

4. 反馈驱动重排序（Feedback-Driven）

用历史执行信号更新 skill 偏好
今天的错误应成为明天的排序信号
通常作为增强层叠加在更广泛的选择管线上
代表：SkillRL, CUA-Skill, ToolExpNet, ExpeL, SMART

关键洞察

Skill 选择本质上是策略问题而非排序问题。四个维度（上下文、组合、成本、反馈）互补而非互斥——实际系统往往同时结合多个维度。

参考