Définition
Le démarrage à froid du serveur MCP est la latence supplémentaire subie lors de la première requête à un serveur MCP qui a été mis à zéro ou inactif, causée par le temps nécessaire pour initialiser le processus ou le conteneur.
En profondeur
La latence de démarrage à froid varie considérablement selon le modèle de déploiement. Les serveurs MCP auto-hébergés fonctionnant comme des fonctions sans serveur (AWS Lambda, Vercel Functions, Google Cloud Run) se réduisent à zéro après une période d'inactivité configurable (généralement 5 à 15 minutes). Le démarrage à froid d'une fonction MCP Node.js est de 800 à 2 000 ms ; Python est de 1 500 à 4 000 ms en raison des frais d'importation. Un démarrage à froid d'un conteneur Docker sur Cloud Run est de 2 000 à 6 000 ms selon la taille de l'image. Les déploiements toujours actifs (VPS, conteneur dédié, ECS avec au moins 1 tâche) éliminent complètement les démarrages à froid au prix d'un calcul inactif. Un VPS à 6 $/mois exécutant un serveur MCP Node.js maintient le processus chaud indéfiniment — moins cher que le coût d'ingénierie du débogage des échecs de démarrage à froid en production. Les points de terminaison MCP hébergés fournis par les fournisseurs d'API (y compris les API de recherche compatibles MCP) sont toujours actifs par conception ; les démarrages à froid sont le problème du fournisseur, pas du développeur. Pour les workflows d'agents où la recherche est appelée plusieurs fois par session, un démarrage à froid de 2 à 4 secondes sur le premier appel est tolérable. Pour les workflows où la recherche est appelée une fois par session, le démarrage à froid représente une grande partie du temps total de la session et doit être atténué avec un ping de maintien en vie (requête OPTIONS légère toutes les 5 minutes).
Exemple d'utilisation
Un agent utilisant un serveur de recherche MCP Python sur Cloud Run a observé une latence de 3 800 ms pour la première appel pour 40 % des sessions (celles commençant après la mise à l'échelle à zéro après 10 minutes d'inactivité). Le passage à un VPS toujours actif à 6 $/mois a éliminé les démarrages à froid et réduit la latence moyenne du premier appel de 1 700 ms à 380 ms.
Plateformes
Démarrage à froid du serveur MCP est pertinent sur les plateformes suivantes, toutes accessibles via l'API unifiée de Scavio :
Termes associés
Fiabilité des outils MCP
La fiabilité d’un outil MCP est la probabilité qu’un outil exposé via MCP renvoie une réponse valide et utilisable au co...
Budget de latence de l'API de recherche
Un budget de latence de l'API de recherche est le temps de réponse maximal acceptable pour un appel d'API de recherche a...
Perte de contexte d'agent
La perte de contexte d'agent est la perte de l'état de raisonnement accumulé lorsqu'un échec d'appel d'outil en milieu d...