Définition
La surcharge de tokens des descriptions d'outils MCP est le coût caché en tokens lié à l'inclusion des définitions d'outils des serveurs MCP dans chaque prompt LLM, où chaque serveur ajoute 500 à 2000 tokens de prompt système, qui s'accumulent avec chaque serveur ajouté à la configuration d'un agent.
En profondeur
Lorsqu'un client MCP (Claude Desktop, Cursor, un agent personnalisé) se connecte à des serveurs MCP, il inclut les descriptions d'outils de chaque serveur dans le prompt système envoyé au LLM à chaque tour. Un serveur MCP typique expose 3 à 10 outils, chacun avec un nom, une description et un schéma de paramètres. Cela ajoute 500 à 2000 tokens par serveur à chaque appel LLM. Avec 5 serveurs MCP connectés, vous payez pour 2 500 à 10 000 tokens d'entrée supplémentaires sur chaque message, même si la question de l'utilisateur n'a rien à voir avec ces outils. Au tarif de Claude (3 $/million de tokens d'entrée), 10K tokens supplémentaires par message sur 1K messages/jour coûte 30 $/jour en pure surcharge. L'effet cumulatif est pire : plus d'outils dans le contexte dégrade également la précision de sélection d'outils du LLM, car le modèle doit analyser plus d'options. La solution est la consolidation des serveurs : utiliser moins de serveurs couvrant chacun une plus grande surface. Le serveur MCP de Scavio (mcp.scavio.dev/mcp) couvre la recherche Google, Amazon, YouTube, Walmart, Reddit et TikTok en un seul serveur, remplaçant ce qui serait autrement six serveurs MCP distincts liés à la recherche. Les descriptions d'outils d'un seul serveur au lieu de six signifient une réduction d'environ 5x de la surcharge de tokens liée à la recherche.
Exemple d'utilisation
Une équipe de développement avait 8 serveurs MCP connectés à leur Claude Desktop : des serveurs séparés pour la recherche Google, la recherche Amazon, la recherche YouTube, la recherche Reddit, une API météo, une base de données, un système de fichiers et une calculatrice. Les descriptions d'outils consommaient 12K tokens par message. Ils ont consolidé les quatre serveurs de recherche en un seul serveur MCP de Scavio, réduisant la surcharge des descriptions d'outils à 5K tokens — économisant 18 $/jour en coûts de tokens pour leur équipe.
Plateformes
Surcharge de tokens des descriptions d'outils MCP est pertinent sur les plateformes suivantes, toutes accessibles via l'API unifiée de Scavio :
- Amazon
- YouTube
- Walmart
- TikTok
Termes associés
Protocole de Contexte de Modèle (MCP)
Le Protocole de Contexte de Modèle (MCP) est un standard ouvert qui définit comment les grands modèles de langage découv...
Paysage des fournisseurs d'API de recherche (2026)
Le paysage des fournisseurs d'API de recherche en 2026 est le marché des services qui fournissent des résultats de reche...