定义
MCP 工具描述 token 开销是在每个 LLM 提示中包含 MCP 服务器工具定义的隐藏 token 成本,每个服务器增加 500-2000 个 token 的系统提示,随添加到代理配置中的每个服务器累积。
深入了解
当 MCP 客户端(Claude Desktop、Cursor、自定义代理)连接到 MCP 服务器时,它在每轮发送给 LLM 的系统提示中包含每个服务器的工具描述。典型的 MCP 服务器暴露 3-10 个工具,每个都有名称、描述和参数 schema。这为每个服务器在每次 LLM 调用中增加 500-2000 个 token。连接了 5 个 MCP 服务器时,你在每条消息上都为 2,500-10,000 个额外输入 token 付费,即使用户的问题与这些工具毫无关系。以 Claude 的定价($3/百万输入 token),每条消息 10K 额外 token 在 1K 条消息/天时每天纯开销 $30。复合效应更糟:上下文中更多工具还会降低 LLM 的工具选择准确性,因为模型必须解析更多选项。解决方案是服务器整合:使用更少的服务器,每个覆盖更多功能面。Scavio 的 MCP 服务器(mcp.scavio.dev/mcp)在单一服务器中覆盖 Google、Amazon、YouTube、Walmart、Reddit 和 TikTok 搜索,替换了原本六个独立的搜索相关 MCP 服务器。一个服务器的工具描述代替六个,意味着搜索相关 token 开销减少约 5 倍。
用法示例
一个开发团队有 8 个 MCP 服务器连接到 Claude Desktop:分别用于 Google 搜索、Amazon 查询、YouTube 搜索、Reddit 搜索、天气 API、数据库、文件系统和计算器。工具描述每条消息消耗 12K token。他们将四个搜索服务器整合为 Scavio 的单一 MCP 服务器,将工具描述开销降至 5K token——为团队每天节省 $18 的 token 成本。
平台
MCP 工具描述 Token 开销在以下平台中相关,所有这些平台都可通过Scavio的统一API访问:
- Amazon
- YouTube
- Walmart
- TikTok