1.5 KiB
1.5 KiB
title, created, updated, type, tags, sources
| title | created | updated | type | tags | sources | |||||
|---|---|---|---|---|---|---|---|---|---|---|
| 历史感知路由 — History-Aware Routing | 2026-06-19 | 2026-06-19 | concept |
|
|
历史感知路由(History-Aware Routing)
定义
历史感知路由是 ACE-Router 的核心范式:路由决策不仅依赖当前查询,还显式使用多轮对话历史——包括中间结果、历史性能和工具相关性——来做上下文感知的精确选择。
为什么需要历史感知
传统 embedding 检索的三大局限:
- 语义重叠:功能相似的工具在向量空间中难以区分
- 忽略历史:只匹配当前查询,丢失了执行进度、失败历史等关键状态
- 压缩失真:即使编码历史,固定向量会压缩复杂状态信息
形式化
c* = arg max π_θ(c | Q, H, C)
- Q:当前查询
- H:对话历史(多轮轨迹)
- C:候选空间(工具集或 Agent 集)
- π_θ:训练的路由器
ACE-Router 的实现方式
从多 Agent 模拟轨迹中提取监督信号:标记每步实际调用的候选 c 作为 ground-truth label,之前的所有交互作为历史 H。将复杂多步轨迹转化为大规模历史感知路由训练数据。
效果
ACE-Router 显式使用历史的模型在 MCP-Universe 上达到 53.4%,而相同基座(Qwen3-8B)仅用查询只有 48.5%——历史感知带来约 5pp 的提升。