Un fil r/ClaudeCode a capturé le dilemme : Opus 4.7 améliore l'agent mais consomme beaucoup sur le forfait Plus. Le réflexe est de passer à Max. La solution moins chère est d'attaquer là où les tokens vont réellement.
Prérequis
- Claude Code CLI
- Un journal de session honnête de 1 jour
Parcours
Étape 1: Auditez où vont les tokens (journal 1 jour)
Ouvrez la trace, comptez.
// Categories: grep+read fanout, MCP descriptions, skill folder, attached docs, system prompt, model choice.Étape 2: Remplacez grep+read par un MCP de recherche de code local sur les grands dépôts
Le plus grand gain unique.
// Install Semble or sourcegraph-cody-bridge.Étape 3: Réduisez les MCP attachés à 4-6 nommés
Réduisez le gonflement des descriptions.
// Drop unused MCPs. Replace 5-8 narrow web skills with one Scavio MCP.Étape 4: Allégez le dossier de compétences
Même logique, surface différente.
// 70 skills → 20-30. See the trim-skills tutorial.Étape 5: Utilisez Sonnet 4.6 par défaut ; passez à Opus 4.7 uniquement pour les tâches difficiles
La solution la moins chère.
// Routine ops → Sonnet 4.6. Architecture decisions, novel logic, hard debugging → Opus 4.7.Étape 6: Re-mesurez après une semaine
Avant/après honnête.
// Track total cost per week vs feature output. Expect 30-50% drop.Exemple Python
# Tuned Plus: ~$50/mo all-in. Blanket Max: $100-200/mo for similar output.Exemple JavaScript
// Config-discipline tutorial.Sortie attendue
Same agent quality on Opus 4.7 for hard tasks, lower model + tuned tools for everything else, and a per-month bill cut by 30-50%.