Définition
Un registre de serveurs MCP est la collection de schémas d'outils (noms, descriptions, définitions de paramètres) qu'un agent compatible MCP charge au démarrage d'une session, consommant des jetons de contexte proportionnellement au nombre et à la complexité des outils enregistrés.
En profondeur
Lorsque Claude Code, Cursor ou un autre client MCP démarre une session, il charge les définitions d'outils de chaque serveur MCP configuré. Chaque outil contribue avec son nom, sa description et ses paramètres JSON Schema à la fenêtre de contexte de l'agent. Un serveur avec 11 outils (comme le point de terminaison MCP de Scavio) peut ajouter 800 à 1200 jetons au contexte. Un serveur avec 30+ outils peut ajouter 3000+ jetons. Cela crée un coût caché : avant même que l'agent ne fasse quoi que ce soit, son contexte est partiellement consommé par les schémas d'outils. L'impact pratique est que les agents avec 5+ serveurs MCP activés peuvent consacrer 5 à 10 % de leur budget de contexte aux seules définitions d'outils. Les stratégies d'atténuation incluent : désactiver les serveurs MCP inutilisés par session, utiliser un filtrage pré-utilisation des outils (modèle Gandalf) pour limiter les outils que l'agent considère, et préférer les serveurs MCP avec moins d'outils bien ciblés plutôt que des registres tentaculaires.
Exemple d'utilisation
Un développeur remarque que les sessions Claude Code sont plus lentes et plus coûteuses que prévu. Il audite son registre MCP : 6 serveurs contribuant 47 outils au total, consommant ~4500 jetons avant même de commencer le travail. Il désactive 3 serveurs rarement utilisés, réduisant la surcharge du registre à ~1800 jetons et économisant environ 0,02 $ par session sur les modèles de niveau Opus.
Plateformes
Registre de serveurs MCP est pertinent sur les plateformes suivantes, toutes accessibles via l'API unifiée de Scavio :
Termes associés
Protocole de Contexte de Modèle (MCP)
Le Protocole de Contexte de Modèle (MCP) est un standard ouvert qui définit comment les grands modèles de langage découv...
Gonflement du contexte
Le gonflement du contexte est l'accumulation de tokens dans la fenêtre de contexte d'un LLM avant que l'utilisateur n'ai...
Budget de tokens d'agent
Un budget de tokens d'agent est une limite programmatique sur le nombre de tokens de contexte qu'un agent IA alloue aux ...