20260625:很多新内容
This commit is contained in:
48
concepts/history-aware-routing.md
Normal file
48
concepts/history-aware-routing.md
Normal file
@@ -0,0 +1,48 @@
|
||||
---
|
||||
title: "历史感知路由 — History-Aware Routing"
|
||||
created: 2026-06-19
|
||||
updated: 2026-06-19
|
||||
type: concept
|
||||
tags: [history-aware, routing, tool-selection, llm-agents]
|
||||
sources:
|
||||
- https://arxiv.org/abs/2601.08276
|
||||
---
|
||||
|
||||
# 历史感知路由(History-Aware Routing)
|
||||
|
||||
## 定义
|
||||
|
||||
历史感知路由是 ACE-Router 的核心范式:路由决策不仅依赖当前查询,还**显式使用多轮对话历史**——包括中间结果、历史性能和工具相关性——来做上下文感知的精确选择。
|
||||
|
||||
## 为什么需要历史感知
|
||||
|
||||
传统 embedding 检索的三大局限:
|
||||
|
||||
1. **语义重叠**:功能相似的工具在向量空间中难以区分
|
||||
2. **忽略历史**:只匹配当前查询,丢失了执行进度、失败历史等关键状态
|
||||
3. **压缩失真**:即使编码历史,固定向量会压缩复杂状态信息
|
||||
|
||||
## 形式化
|
||||
|
||||
```
|
||||
c* = arg max π_θ(c | Q, H, C)
|
||||
```
|
||||
|
||||
- Q:当前查询
|
||||
- H:对话历史(多轮轨迹)
|
||||
- C:候选空间(工具集或 Agent 集)
|
||||
- π_θ:训练的路由器
|
||||
|
||||
## ACE-Router 的实现方式
|
||||
|
||||
从多 Agent 模拟轨迹中提取监督信号:标记每步实际调用的候选 c 作为 ground-truth label,之前的所有交互作为历史 H。将复杂多步轨迹转化为大规模历史感知路由训练数据。
|
||||
|
||||
## 效果
|
||||
|
||||
ACE-Router 显式使用历史的模型在 MCP-Universe 上达到 53.4%,而相同基座(Qwen3-8B)仅用查询只有 48.5%——历史感知带来约 5pp 的提升。
|
||||
|
||||
## 参考
|
||||
|
||||
- [[ace-router|ACE-Router]]
|
||||
- [[yao-ace-router-2026|论文]]
|
||||
- [[trajectory-synthesis|轨迹合成]]
|
||||
Reference in New Issue
Block a user