2.7 KiB
2.7 KiB
title, created, updated, type, tags, sources
| title | created | updated | type | tags | sources | ||||||||
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| ACE-Router:历史感知路由 | 2026-06-19 | 2026-06-19 | paper |
|
|
ACE-Router:历史感知路由
Zhiyuan Yao, Zishan Xu, Yifu Guo 等 · 2026 · arXiv:2601.08276
核心问题
MCP 工具生态爆炸式增长,现有方案各有限制:
- 静态注入:上下文窗口有限,无法规模化
- Embedding 检索:静态语义匹配,缺乏多轮历史感知
- 通用 LLM:推理强但缺乏精确工具辨识力
核心方案:训练一个 Router
ACE-Router 不从零推理——直接训练一个专门的路由器,将多轮对话历史对齐到正确的路由决策。
三阶段框架
1. candidate-graph
构建语义相似图 → 五种变异算子扩展候选空间 → 627→2005 工具
2. trajectory-synthesis
候选图采样 → 四角色模拟(Planner/User/Assistant/Tool Agent)→ 15,092 训练样本。环境无关:LLM 模拟执行,无需真实 API。
3. light-routing-agent
仅两个工具:router_invoke + tool_execute。路由与执行解耦,可插拔适配工具选择和 Agent 选择。
关键数据
| 指标 | ACE-Router | Best Baseline |
|---|---|---|
| MCP-Universe | 53.44% | 49.79% (Gemini-2.5-Pro) |
| MCP-Mark | 60.00% | ~50% (ReAct) |
| 扩展候选池 | 53.02% (稳定) | 36.47% (ReAct 崩溃) |
| 噪声环境 | 56.00% | 32% (Gemini-2.5-Pro) |
| 多 Agent 泛化 | 88-92% | — (零训练迁移) |
8B 专用路由器 > 巨型通用模型(GPT-4o, Gemini-2.5-Pro)——证明了精确工具辨识不是靠扩大推理能力,而是靠专门训练。
MCP 工具选择三篇之比较
| | fei-mcp-zero-2025 | gaurav-dynamic-react-2025 | ACE-Router | |---|---|---|---|---| | 机制 | 主动请求 + 层次路由 | meta-tools + 语义搜索 | 训练专用路由器 | | 历史感知 | 迭代请求(隐式) | ReAct 框架内 | 显式训练对齐 | | 规模适应 | 理论 O(m+k) | 工程验证 | 训练+噪声双重验证 | | 泛化 | MCP 工具 | MCP 工具 | 工具→Agent 零训练迁移 |
关键概念
- ace-router
- history-aware-routing
- candidate-graph
- self-evolutionary-mutation
- trajectory-synthesis
- light-routing-agent
- agent-web
来源:原始存档