20260625:很多新内容

This commit is contained in:
2026-06-25 14:08:47 +08:00
parent 91fac5b6fc
commit 6021dea160
375 changed files with 19263 additions and 251 deletions

View File

@@ -0,0 +1,58 @@
---
title: "MCP-tools 数据集"
created: 2026-06-19
updated: 2026-06-19
type: concept
tags: [dataset, mcp, tool-discovery, benchmark, evaluation]
sources:
- https://arxiv.org/abs/2506.01056
---
# MCP-tools 数据集
## 定义
MCP-tools 是 MCP-Zero 论文构建的**首个面向检索的工具发现数据集**,从官方 Model Context Protocol 仓库收集了 308 个 MCP server 和 2,797 个 tool。
## 与其他 MCP 数据集的区别
| | MCPBench | MCP-tools |
|---|---|---|
| 关注点 | Server 可用性、延迟测试 | 语义工具发现和检索 |
| 目标 | 基础设施评估 | Agent 工具发现能力评估 |
## 数据结构
```json
{
"server_name": "string",
"server_description": "string",
"server_summary": "string", // MCP-Zero 增强摘要
"tools": [
{
"name": "string",
"description": "string",
"parameter": {
"param1": "(type) description",
"param2": "(Optional, type) description"
}
}
]
}
```
## 增强摘要
MCP-Zero 为每个 server 构建了增强摘要——包含综合使用示例——用于提升 server 级语义匹配精度。对比仅用原始描述(通常只有一句话)有显著改善。
## 关键指标
- 308 servers × 2,797 tools
- 全量 tool schema 约 **248.1K tokens**
- 单个 GitHub MCP server**4,600+ tokens**26 tools
## 参考
- [[mcp-protocol|MCP 协议]]
- [[fei-mcp-zero-2025|MCP-Zero 论文]]
- [[active-tool-discovery|主动工具发现]]