Définition
Le gonflement du schéma d'outils MCP est la consommation excessive de tokens de contexte d'agent par les schémas de définition d'outils chargés depuis plusieurs serveurs MCP au démarrage de la session, réduisant le contexte disponible pour le travail réel et augmentant les coûts LLM par session.
En profondeur
Chaque serveur MCP enregistré dans la configuration d'un agent contribue avec des schémas d'outils à la fenêtre de contexte au début de la session. Chaque définition d'outil comprend un nom, une description et un schéma JSON pour les paramètres. Un serveur bien conçu avec 5 outils peut ajouter 400-600 tokens. Un serveur tentaculaire avec 20+ outils peut ajouter 2000-4000 tokens. Avec 5 serveurs MCP activés, la surcharge de schéma peut atteindre 5000-15000 tokens avant que l'agent ne fasse aucun travail. Sur Claude Opus à ~$15/million de tokens, 10K tokens de gonflement de schéma coûte ~$0.15 par session. À 50 sessions/jour, cela représente $7.50/jour ou $225/mois de pur surcoût. Stratégies d'atténuation : 1) Auditer et désactiver les serveurs MCP inutilisés par projet (tous les projets n'ont pas besoin de chaque serveur). 2) Utiliser le chargement conditionnel là où le framework d'agent le supporte. 3) Préférer les serveurs avec moins d'outils bien définis plutôt que des registres fourre-tout. 4) Utiliser le filtrage pré-utilisation d'outils (modèle Gandalf) pour que l'agent ne 'voie' que les schémas d'outils pertinents à chaque tour. Le serveur MCP de Scavio enregistre 11 outils pour 5 plateformes, ce qui représente une empreinte modérée (~900 tokens) par rapport aux serveurs qui enregistrent 30+ outils.
Exemple d'utilisation
Un développeur exécute Claude Code avec 8 serveurs MCP activés : search, browser, memory, git, database, file system, image generation, et documentation. Surcharge totale du schéma d'outils : ~12,000 tokens. Après audit, il désactive les serveurs browser, image generation et database pour les tâches de codage. Nouvelle surcharge : ~5,000 tokens. Le contexte disponible pour le code et la conversation augmente de 7,000 tokens par session.
Plateformes
Gonflement du schéma d'outils MCP est pertinent sur les plateformes suivantes, toutes accessibles via l'API unifiée de Scavio :
Termes associés
Protocole de Contexte de Modèle (MCP)
Le Protocole de Contexte de Modèle (MCP) est un standard ouvert qui définit comment les grands modèles de langage découv...
Registre de serveurs MCP
Un registre de serveurs MCP est la collection de schémas d'outils (noms, descriptions, définitions de paramètres) qu'un ...
Gonflement du contexte
Le gonflement du contexte est l'accumulation de tokens dans la fenêtre de contexte d'un LLM avant que l'utilisateur n'ai...