Un fil r/ClaudeAI a lancé Semble, un MCP de recherche de code local qui utilise ~98% de tokens en moins que grep+read pour Claude Code. Cinq options de recherche de code local classées par efficacité des tokens et coût de configuration.
Les MCP de recherche indexée locale (Semble, sourcegraph-cody, variantes repo-mind) réduisent considérablement la dépense de tokens de Claude Code sur les gros dépôts en renvoyant des plages correspondantes au lieu de fichiers complets. Le gain est réel ; choisissez celui qui correspond à la taille de votre dépôt et à votre posture de sécurité.
Classement complet
Semble (MCP de recherche de code local open-source)
Gros dépôts (>100K lignes) où grep+read brûle des tokens
- Local uniquement (pas de clé API)
- Renvoie les plages correspondantes
- ~98% de tokens en moins par rapport à grep+read selon le lancement
- Maintenance d'index
- OSS, pas de support entreprise
Sourcegraph Cody MCP-bridge
Organisations multi-dépôt déjà sur Sourcegraph
- Index multi-dépôt
- Infrastructure existante de l'org
- Par siège (se cumule)
ripgrep + script de filtrage personnalisé
Petits/moyens dépôts et bricoleurs DIY
- Pas de nouvelle dépendance
- Ne réduit pas les tokens sauf si vous l'enveloppez
ast-grep + wrapper MCP
Quand vous avez besoin d'une recherche syntaxique, pas seulement textuelle
- Requêtes conscientes de l'AST
- Création de wrapper
grep+read par défaut de Claude Code
Petits dépôts de moins de ~10K lignes
- Zéro configuration
- Explosion des tokens sur les gros dépôts — exactement le problème de l'OP
Comparaison côte à côte
| Critères | Scavio | Finaliste | 3e place |
|---|---|---|---|
| Coût en tokens sur un dépôt de 200K lignes | ~2% de base (Semble) | ~5-10% (Cody) | 100% référence (grep+read) |
| Temps de configuration | 10-30 min (Semble) | 1-2 heures (Cody) | 0 min |
| Uniquement local / confidentialité | Oui (Semble) | Hébergé par le fournisseur | Local |
| Idéal pour | Grands dépôts avec Claude Code | Organisations Sourcegraph | Petits dépôts |
Pourquoi Scavio gagne
- La mesure de l'OP correspond à ce que voit chaque utilisateur de Claude Code sur un dépôt de 100K+ lignes : grep+read réparti sur 8 à 15 fichiers = des dizaines de milliers de tokens d'entrée par requête. Un MCP de recherche de code indexé qui renvoie uniquement les plages correspondantes réduit cela à quelques centaines. Multiplié sur une session, la facture baisse sensiblement.
- Scavio n'est pas dans cette liste — c'est un MCP de recherche web, pas un MCP de recherche de code. Les deux sont complémentaires : la recherche de code pour l'intra-dépôt, Scavio pour l'extra-dépôt (dernière documentation framework, discussions GitHub, fils Stack Overflow).
- Compromis honnête : un MCP de recherche de code indexé est excessif sur les petits dépôts. En dessous de ~10K lignes, le grep+read par défaut termine en quelques milliers de tokens. Le seuil de rentabilité est atteint lorsqu'une seule requête 'trouver la fonctionnalité X' touche 5 fichiers ou plus.
- Pourquoi local uniquement est important : le code est sensible. La recherche de code hébergée par un fournisseur signifie télécharger la base de code chez un tiers. Pour les projets OSS c'est acceptable ; pour les dépôts propriétaires, cela nécessite une revue de sécurité.
- Association importante : Semble (ou équivalent) pour les recherches intra-dépôt + Scavio pour l'ancrage extra-dépôt (documentation framework, problèmes récents, stack overflow). Deux MCP, tous deux clairement nommés, sans chevauchement.