title, created, updated, type, tags, sources
| title |
created |
updated |
type |
tags |
sources |
| 轨迹合成 — Trajectory Synthesis |
2026-06-19 |
2026-06-19 |
concept |
| trajectory-synthesis |
| training-data |
| multi-agent-simulation |
| ace-router |
|
|
轨迹合成(Trajectory Synthesis)
定义
Trajectory Synthesis 是 ACE-Router 的第二阶段:通过多 Agent 角色模拟从候选图生成多轮交互轨迹,从中提取历史感知路由的监督信号。
四角色模拟
设计优势
- 环境无关:LLM 模拟执行结果,无需访问真实 API——可大规模扩展
- 历史感知:从轨迹中提取 (历史→路由决策) 对,而非静态 (查询→工具) 对
- 结构化监督:标记每步实际调用的候选作为 ground-truth label
产出
- 627 初始工具 → 2005 扩展工具(来自候选图)
- 15,092 个训练样本(供 Qwen3-8B LoRA 微调)
参考