Définition
Le budget de contexte MCP est la partie de la fenêtre de contexte d'un LLM qui est consommée par les définitions d'outils MCP (schémas, descriptions, paramètres) et les réponses des outils, réduisant ainsi l'espace disponible pour l'historique de la conversation, les instructions de l'utilisateur et le raisonnement.
En profondeur
Chaque outil connecté à un LLM via MCP a un coût mesuré en jetons : le nom de l'outil, sa description, le schéma des paramètres et tout exemple consomment collectivement de l'espace dans la fenêtre de contexte. Une définition d'outil MCP typique utilise 200-500 jetons. Un serveur MCP avec 10 outils peut consommer 2 000-5 000 jetons rien qu'en définitions. Si l'agent a également des données de réponse d'outil dans le contexte (résultats de recherche, lignes de base de données, contenus de fichiers), le budget augmente encore. Le budget de contexte devient une préoccupation pratique lorsque les agents ont plusieurs serveurs MCP connectés. Une configuration avec les serveurs MCP Scavio (recherche), GitHub (code), Postgres (base de données), Slack (messagerie) et Linear (gestion de projet) pourrait avoir plus de 30 définitions d'outils consommant plus de 10 000 jetons -- environ 5-10 % d'une fenêtre de contexte de 128K, ou 20-40 % d'une fenêtre plus petite de 32K. Cela laisse moins de place pour l'historique de la conversation, ce qui peut faire perdre à l'agent le fil des instructions ou du contexte antérieurs. Les stratégies de gestion incluent : le chargement à la demande des outils (ne charger les outils que lorsque nécessaire), la compression des descriptions d'outils (descriptions plus courtes qui transmettent toujours la fonction), la consolidation des serveurs (moins de serveurs avec des ensembles d'outils ciblés), et la sélection de LLM avec des fenêtres de contexte plus grandes pour les flux de travail riches en outils. La conception idéale d'un serveur MCP expose uniquement les outils dont l'agent cible a réellement besoin -- le serveur MCP de Scavio, par exemple, expose un ensemble ciblé d'outils de recherche plutôt que des dizaines de fonctions utilitaires.
Exemple d'utilisation
Un développeur remarque que les réponses de Claude Code deviennent plus courtes et moins précises. En vérifiant le contexte, il découvre que 5 serveurs MCP contribuent pour 15 000 jetons de définitions d'outils. Il passe au chargement à la demande et supprime 2 serveurs MCP rarement utilisés, libérant ainsi 8 000 jetons de budget de contexte pour la conversation réelle.
Plateformes
Budget de contexte MCP est pertinent sur les plateformes suivantes, toutes accessibles via l'API unifiée de Scavio :
- Amazon
- YouTube
- Walmart
Termes associés
Chargement à la demande des outils MCP
Le chargement à la demande des outils MCP est un modèle où un agent IA charge les définitions des outils MCP dans son co...
Protocole de Contexte de Modèle (MCP)
Le Protocole de Contexte de Modèle (MCP) est un standard ouvert qui définit comment les grands modèles de langage découv...