Un build r/opencodeCLI a rapporté une réduction de 99,3% de la charge du schéma MCP via une passerelle. Ce tutoriel présente le modèle : compression des descriptions d'outils, chargement paresseux du schéma et passerelles spécifiques aux surfaces.
Prérequis
- Passerelle MCP en cours d'exécution (voir le tutoriel associé)
Parcours
Étape 1: Auditer le coût actuel des tokens par session
Mesurer les tokens de charge de schéma au début de la session.
// In Claude Code, run /context and inspect tools section.Étape 2: Identifier les outils en double ou qui se chevauchent
Si trois MCP exposent chacun `search`, le modèle gaspille des tokens.
// Replace 4 single-surface search MCPs with 1 multi-surface MCP (Scavio).Étape 3: Utiliser Scavio MCP pour la surface de recherche
Un MCP, six outils, ~80 tokens par description d'outil.
{ "scavio": { "url": "https://mcp.scavio.dev/mcp", "headers": { "x-api-key": "${SCAVIO_API_KEY}" } } }Étape 4: Utiliser une passerelle pour les MCP non-recherche
Postgres, GitHub, outils internes proxy via la passerelle.
// Already covered in 'mcp-proxy-setup' tutorial.Étape 5: Remesurer les tokens
La charge du schéma devrait chuter considérablement.
// Expected: from 30K-50K to under 5K.Exemple Python
# Configuration-driven. No code beyond the JSON above.Exemple JavaScript
// See JSON above.Sortie attendue
Schema-load tokens drop 80-99% depending on starting fleet size. A 30-turn session that cost $0.50 on schema overhead drops under $0.05.