50 lines
1.6 KiB
Markdown
50 lines
1.6 KiB
Markdown
---
|
||
title: "ACE-Router — 训练专用路由器"
|
||
created: 2026-06-19
|
||
updated: 2026-06-19
|
||
type: concept
|
||
tags: [router-training, mcp, tool-selection, history-aware, agent-web]
|
||
sources:
|
||
- https://arxiv.org/abs/2601.08276
|
||
---
|
||
|
||
# ACE-Router
|
||
|
||
## 定义
|
||
|
||
ACE-Router 是 Yao et al. (2026) 提出的**训练专用路由器框架**:不依赖 embedding 静态匹配或 LLM 通用推理,而是训练一个专门模型,将多轮对话历史显式对齐到精确的路由决策。
|
||
|
||
## 三阶段管线
|
||
|
||
```
|
||
① Candidate Graph → ② Trajectory Synthesis → ③ Light Routing Agent
|
||
(扩展候选空间) (生成训练数据) (可插拔部署)
|
||
```
|
||
|
||
### ① Candidate Graph + 自进化变异
|
||
- 基于语义相似(τ=0.82)构建候选图
|
||
- 5 种变异算子:功能增强、参数变异、工作流链接、辅助操作、使用扩展
|
||
- 627 初始工具 → 2005 工具
|
||
|
||
### ② 多 Agent 轨迹合成
|
||
- DFS 随机游走采样 + 四角色模拟
|
||
- 环境无关:LLM 模拟执行,无需真实 API
|
||
- 产出 15,092 个历史感知训练样本
|
||
|
||
### ③ Light Routing Agent
|
||
仅两个工具:router_invoke + tool_execute。路由与执行解耦 → 路由逻辑独立于具体工具定义。
|
||
|
||
## 关键结果
|
||
|
||
- **8B 专用路由器 > 巨型通用模型**:GPT-4o (47.4%) vs ACE-Router (53.4%)
|
||
- 扩展候选池:ReAct 从 41.8% 崩溃到 36.5%,ACE-Router 稳定在 53.0%
|
||
- 噪声鲁棒:GPT-4o 28% / Gemini 32%,ACE-Router 保持 56%
|
||
- 工具路由 → Agent 路由零训练迁移:88-92%
|
||
|
||
## 参考
|
||
|
||
- [[yao-ace-router-2026|论文]]
|
||
- [[history-aware-routing|历史感知路由]]
|
||
- [[candidate-graph|候选图]]
|
||
- [[light-routing-agent|轻量路由 Agent]]
|