Files
myWiki/raw/papers/fei-mcp-zero-2025.md

57 lines
2.1 KiB
Markdown
Raw Blame History

This file contains ambiguous Unicode characters

This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.

---
title: "MCP-Zero: Active Tool Discovery for Autonomous LLM Agents"
created: 2026-06-19
updated: 2026-06-19
type: paper-raw
source: https://arxiv.org/abs/2506.01056
arxiv_id: 2506.01056
version: v4
---
# MCP-Zero: Active Tool Discovery for Autonomous LLM Agents
**Authors**: Xiang Fei, Xiawu Zheng*, Hao Feng (Xiamen University, USTC)
**Published**: 2025-06-01 (v4: 2025-06-24)
**Venue**: arXiv:2506.01056 (cs.AI, cs.SE)
**Code**: https://github.com/xfey/MCP-Zero
## 核心洞察
当前 LLM Agent 的工具使用是**被动的**——将所有 tool schema 注入 system prompt 让模型从中选择。这有两个致命问题:(1) 上下文开销爆炸GitHub MCP server 一个就需要 4600+ tokens全生态 248K tokens(2) 决策自主权被剥夺——模型从"自主能力构建者"退化为"被动选择器"。
MCP-Zero 将范式翻转为**主动工具发现Active Tool Discovery**Agent 自主识别能力缺口,按需生成结构化工具请求,系统匹配并返回。
## 三大机制
### 1. Active Tool Request
模型自主生成结构化请求:
```
<tool_assistant>
server: File system allowing file operations
tool: Read file by filename
</tool_assistant>
```
关键:请求在**工具文档的语义空间**中,语义对齐度高于原始用户查询。
### 2. Hierarchical Semantic Routing
两级粗到细检索:
- 第一级server 字段 → 匹配 server 描述(含增强摘要)
- 第二级tool 字段 → 在选中的 server 内排序
- 评分score = (s_server × s_tool) × max(s_server, s_tool)
- 复杂度从 O(n) 降至 O(m+k)m+k ≪ n
### 3. Iterative Capability Extension
支持多轮迭代发现:模型可逐步构建跨域 toolchain文件→编辑→执行当前工具不足时可优化请求重新检索。
## 关键数据
- 数据集 MCP-tools308 servers, 2,797 tools
- APIBank 上 token 消耗降低 **98%** 且保持高准确率
- 在 248.1K tokens 的工具描述空间中精准选择
## 理论分析
- 主动发现建模为 active learningr* = arg max I(T*; r|s_t)
- 注意力分布:被动 O(1/n) ↘ 主动 O(1/k)k ≪ n
- 语义对齐优势cos(e_r, e_t) > cos(e_q, e_t)