Définition
Le chargement à la demande des outils MCP est un modèle où un agent IA charge les définitions des outils MCP dans son contexte uniquement lorsque c'est nécessaire, plutôt que de précharger tous les outils disponibles au début de la conversation, ce qui réduit la consommation du contexte et améliore la concentration.
En profondeur
Chaque définition d'outil MCP consomme des tokens dans le contexte du LLM : le nom, la description, le schéma des paramètres et les exemples peuvent ajouter des centaines ou milliers de tokens par outil. Lorsqu'un agent a accès à 20+ serveurs MCP avec 5 à 10 outils chacun, précharger toutes les définitions peut consommer 10 à 30 % du contexte disponible avant même le début de la conversation. Le chargement à la demande résout ce problème en différant le chargement des schémas d'outils jusqu'à ce que l'agent détermine qu'il a besoin d'une capacité spécifique. Claude Code implémente ce modèle : les serveurs MCP sont configurés dans le fichier mcp.json du projet, mais leurs schémas d'outils ne sont pas chargés dans chaque conversation. Lorsque la requête de l'utilisateur suggère qu'un outil pourrait être nécessaire (par exemple, mentionner la recherche, les données web ou une plateforme spécifique), l'agent charge dynamiquement les outils du serveur MCP concerné. Cela permet de garder le contexte léger pour les conversations qui n'ont pas besoin d'outils externes tout en maintenant un accès complet aux outils lorsque nécessaire. Le compromis : le chargement à la demande ajoute un léger temps de latence lors du premier chargement des outils (l'agent doit récupérer et analyser la liste des outils du serveur MCP), et l'agent peut parfois ne pas charger un outil qu'il aurait dû utiliser car il n'a pas reconnu le besoin. L'invocation explicite d'outil (l'utilisateur tapant un nom d'outil ou utilisant une commande slash) contourne ce problème. Pour les agents avec de nombreuses connexions MCP, le chargement à la demande est essentiel — sans cela, le contexte se remplit de définitions d'outils qui ne seront peut-être jamais utilisées dans une session donnée.
Exemple d'utilisation
Un développeur a configuré les serveurs MCP Scavio, GitHub, Postgres et Slack dans Claude Code. Lorsqu'il pose une question de codage, aucun outil MCP n'est chargé — tout l'espace du contexte est disponible pour le code. Lorsqu'il demande 'quels sont les meilleurs résultats pour [mot-clé] ?', Claude Code charge les outils MCP Scavio à la demande et exécute la recherche.
Plateformes
Chargement à la demande des outils MCP est pertinent sur les plateformes suivantes, toutes accessibles via l'API unifiée de Scavio :
- Amazon
- YouTube
- Walmart
Termes associés
Protocole de Contexte de Modèle (MCP)
Le Protocole de Contexte de Modèle (MCP) est un standard ouvert qui définit comment les grands modèles de langage découv...
Budget de contexte MCP
Le budget de contexte MCP est la partie de la fenêtre de contexte d'un LLM qui est consommée par les définitions d'outil...