Définition
Le gonflement des compétences d'agent est l'effet composé du coût en tokens par message qui résulte du fait de laisser 50 à 100 compétences par défaut chargées dans la surface d'outils d'un agent alors que seulement 20 à 30 sont réellement invoquées dans le flux de travail réel de l'utilisateur — payer pour les tokens de description des compétences qui ne sont jamais déclenchées.
En profondeur
Un post r/hermesagent en avril 2026 documentait la réduction d'un dossier par défaut de 73 compétences à 26 compétences actives, citant le gonflement des tokens par message sur des centaines de messages par semaine. Chaque description de compétence coûte ~100-200 tokens d'entrée ; 70 compétences × 150 tokens = 10K tokens par message rien que pour décrire les outils. La solution : un audit d'utilisation de 2 semaines → supprimer les compétences jamais invoquées, supprimer les doublons, remplacer 5 à 8 compétences web/recherche/grattage étroites par un seul Scavio MCP. Le calcul des tokens s'accumule en cas d'utilisation intensive (300+ messages/semaine) en factures LLM hebdomadaires mesurables.
Exemple d'utilisation
Un utilisateur avancé envoie 300 messages Claude Code par semaine avec 70 compétences par défaut chargées. Frais généraux d'entrée par message provenant des descriptions de compétences : ~10K tokens. Réduire à 26 + remplacer les compétences web étroites par Scavio MCP → ~4K tokens. 6K économisés × 300 messages × taux d'entrée Sonnet 4.6 = ~5-10 $/semaine économisés.
Plateformes
Gonflement des compétences d'agent est pertinent sur les plateformes suivantes, toutes accessibles via l'API unifiée de Scavio :
Termes associés
Gonflement du contexte
Le gonflement du contexte est l'accumulation de tokens dans la fenêtre de contexte d'un LLM avant que l'utilisateur n'ai...
Coût des tokens HTML
Le coût des tokens HTML est le coût d'entrée LLM lié à l'injection de HTML brut dans une fenêtre de contexte par rapport...
Consolidation des fournisseurs d'API de recherche
La consolidation des fournisseurs d'API de recherche est la pratique consistant à remplacer 3 à 5 API de recherche à usa...