---
title: "ACE-Router：历史感知路由"
created: 2026-06-19
updated: 2026-06-19
type: paper
tags: [router-training, history-aware, mcp, tool-selection, agent-web, candidate-graph]
sources:
  - https://arxiv.org/abs/2601.08276
  - https://github.com/euyis1019/ACE-Router
---

# ACE-Router：历史感知路由

> **Zhiyuan Yao, Zishan Xu, Yifu Guo 等** · 2026 · arXiv:2601.08276

## 核心问题

MCP 工具生态爆炸式增长，现有方案各有限制：
- **静态注入**：上下文窗口有限，无法规模化
- **Embedding 检索**：静态语义匹配，缺乏多轮历史感知
- **通用 LLM**：推理强但缺乏精确工具辨识力

## 核心方案：训练一个 Router

ACE-Router 不从零推理——直接**训练一个专门的路由器**，将多轮对话历史对齐到正确的路由决策。

## 三阶段框架

### 1. [[candidate-graph|Candidate Graph + 自进化变异]]
构建语义相似图 → 五种变异算子扩展候选空间 → 627→2005 工具

### 2. [[trajectory-synthesis|多 Agent 轨迹合成]]
候选图采样 → 四角色模拟（Planner/User/Assistant/Tool Agent）→ 15,092 训练样本。环境无关：LLM 模拟执行，无需真实 API。

### 3. [[light-routing-agent|Light Routing Agent]]
仅两个工具：`router_invoke` + `tool_execute`。路由与执行解耦，可插拔适配工具选择和 Agent 选择。

## 关键数据

| 指标 | ACE-Router | Best Baseline |
|------|:---:|:---:|
| MCP-Universe | **53.44%** | 49.79% (Gemini-2.5-Pro) |
| MCP-Mark | **60.00%** | ~50% (ReAct) |
| 扩展候选池 | **53.02%** (稳定) | 36.47% (ReAct 崩溃) |
| 噪声环境 | **56.00%** | 32% (Gemini-2.5-Pro) |
| 多 Agent 泛化 | **88-92%** | — (零训练迁移) |

**8B 专用路由器 > 巨型通用模型**（GPT-4o, Gemini-2.5-Pro）——证明了精确工具辨识不是靠扩大推理能力，而是靠专门训练。

## MCP 工具选择三篇之比较

| | [[fei-mcp-zero-2025|MCP-Zero]] | [[gaurav-dynamic-react-2025|Dynamic ReAct]] | ACE-Router |
|---|---|---|---|---|
| 机制 | 主动请求 + 层次路由 | meta-tools + 语义搜索 | **训练专用路由器** |
| 历史感知 | 迭代请求（隐式） | ReAct 框架内 | **显式训练对齐** |
| 规模适应 | 理论 O(m+k) | 工程验证 | **训练+噪声双重验证** |
| 泛化 | MCP 工具 | MCP 工具 | **工具→Agent 零训练迁移** |

## 关键概念

- [[ace-router|ACE-Router 框架]]
- [[history-aware-routing|历史感知路由]]
- [[candidate-graph|候选图]]
- [[self-evolutionary-mutation|自进化变异]]
- [[trajectory-synthesis|轨迹合成]]
- [[light-routing-agent|轻量路由 Agent]]
- [[agent-web|Agent Web]]

来源：[原始存档](raw/papers/yao-ace-router-2026.md)