Deux r/posts de mai 2026 (réduction de 40% de Claude Code via consolidation ; routage en masse 20× via Qwen3 35B sur Nosana) font valoir le cas. Ceci expose la recette pragmatique.
Prérequis
- Claude Code Plus ou supérieur
- Semble installé pour la recherche dans le dépôt
- Clé API Scavio
- Fenêtre de mesure de deux semaines
Parcours
Étape 1: Référence : mesure sur 2 semaines avant tout changement
Capturer les jetons d'entrée/sortie par message avant de toucher à quoi que ce soit.
// Use Anthropic console or self-rolled wrapper.Étape 2: Installer Semble
Renvoie les plages correspondantes, pas les fichiers complets.
// Per Semble repo README:
// claude mcp add semble <semble-url>Étape 3: Installer Scavio MCP
Remplace 5 à 8 outils web étroits par un seul.
claude mcp add scavio https://mcp.scavio.dev/mcp --header 'x-api-key: $SCAVIO_API_KEY'Étape 4: Supprimez les compétences web/grattage inutilisées
Consolidation des outils = réduction des jetons de description par message.
// claude mcp list → identify duplicates and never-invoked → claude mcp remove <name>Étape 5: Mettre à jour CLAUDE.md / le prompt système
Règle de routage.
// CLAUDE.md: For in-repo code lookup use semble. For out-of-repo use scavio.search. Don't grep+read.Étape 6: Remesurer sur 2 semaines après
Jetons d'entrée + sortie par message.
// Compare before/after. Heavy users on >100K LOC repos typically see 30-50% per-week cost cut.Étape 7: Facultatif : MCP de routage LLM local pour les étapes en masse
Spécifique à la charge de travail.
// claude mcp add local-llm <mcp-url>Exemple Python
# Heavy user with $300/mo in tokens cutting 40% saves ~$120/mo.Exemple JavaScript
// Same shape; the work is config + system prompt + measurement.Sortie attendue
Per-week Claude Code token cost drops 30-50% on heavy users, measured before/after.