myWiki/concepts/history-aware-routing.md

---
title: "历史感知路由 — History-Aware Routing"
created: 2026-06-19
updated: 2026-06-19
type: concept
tags: [history-aware, routing, tool-selection, llm-agents]
sources:
  - https://arxiv.org/abs/2601.08276
---

# 历史感知路由（History-Aware Routing）

## 定义

历史感知路由是 ACE-Router 的核心范式：路由决策不仅依赖当前查询，还**显式使用多轮对话历史**——包括中间结果、历史性能和工具相关性——来做上下文感知的精确选择。

## 为什么需要历史感知

传统 embedding 检索的三大局限：

1. **语义重叠**：功能相似的工具在向量空间中难以区分
2. **忽略历史**：只匹配当前查询，丢失了执行进度、失败历史等关键状态
3. **压缩失真**：即使编码历史，固定向量会压缩复杂状态信息

## 形式化

```
c* = arg max π_θ(c | Q, H, C)
```

- Q：当前查询
- H：对话历史（多轮轨迹）
- C：候选空间（工具集或 Agent 集）
- π_θ：训练的路由器

## ACE-Router 的实现方式

从多 Agent 模拟轨迹中提取监督信号：标记每步实际调用的候选 c 作为 ground-truth label，之前的所有交互作为历史 H。将复杂多步轨迹转化为大规模历史感知路由训练数据。

## 效果

ACE-Router 显式使用历史的模型在 MCP-Universe 上达到 53.4%，而相同基座（Qwen3-8B）仅用查询只有 48.5%——历史感知带来约 5pp 的提升。

## 参考

- [[ace-router|ACE-Router]]
- [[yao-ace-router-2026|论文]]
- [[trajectory-synthesis|轨迹合成]]