Files
myWiki/papers/yao-ace-router-2026.md

2.7 KiB
Raw Blame History

title, created, updated, type, tags, sources
title created updated type tags sources
ACE-Router历史感知路由 2026-06-19 2026-06-19 paper
router-training
history-aware
mcp
tool-selection
agent-web
candidate-graph
https://arxiv.org/abs/2601.08276
https://github.com/euyis1019/ACE-Router

ACE-Router历史感知路由

Zhiyuan Yao, Zishan Xu, Yifu Guo 等 · 2026 · arXiv:2601.08276

核心问题

MCP 工具生态爆炸式增长,现有方案各有限制:

  • 静态注入:上下文窗口有限,无法规模化
  • Embedding 检索:静态语义匹配,缺乏多轮历史感知
  • 通用 LLM:推理强但缺乏精确工具辨识力

核心方案:训练一个 Router

ACE-Router 不从零推理——直接训练一个专门的路由器,将多轮对话历史对齐到正确的路由决策。

三阶段框架

1. candidate-graph

构建语义相似图 → 五种变异算子扩展候选空间 → 627→2005 工具

2. trajectory-synthesis

候选图采样 → 四角色模拟Planner/User/Assistant/Tool Agent→ 15,092 训练样本。环境无关LLM 模拟执行,无需真实 API。

3. light-routing-agent

仅两个工具:router_invoke + tool_execute。路由与执行解耦,可插拔适配工具选择和 Agent 选择。

关键数据

指标 ACE-Router Best Baseline
MCP-Universe 53.44% 49.79% (Gemini-2.5-Pro)
MCP-Mark 60.00% ~50% (ReAct)
扩展候选池 53.02% (稳定) 36.47% (ReAct 崩溃)
噪声环境 56.00% 32% (Gemini-2.5-Pro)
多 Agent 泛化 88-92% — (零训练迁移)

8B 专用路由器 > 巨型通用模型GPT-4o, Gemini-2.5-Pro——证明了精确工具辨识不是靠扩大推理能力而是靠专门训练。

MCP 工具选择三篇之比较

| | fei-mcp-zero-2025 | gaurav-dynamic-react-2025 | ACE-Router | |---|---|---|---|---| | 机制 | 主动请求 + 层次路由 | meta-tools + 语义搜索 | 训练专用路由器 | | 历史感知 | 迭代请求(隐式) | ReAct 框架内 | 显式训练对齐 | | 规模适应 | 理论 O(m+k) | 工程验证 | 训练+噪声双重验证 | | 泛化 | MCP 工具 | MCP 工具 | 工具→Agent 零训练迁移 |

关键概念

来源:原始存档