Un fil r/hermesagent a argumenté que les dossiers de compétences gonflés coûtent de vrais tokens à chaque message. L'auteur est passé de 73 compétences par défaut à 26. Cinq approches classées pour garder les dossiers de compétences honnêtes.
Audit d'abord (compter les tokens par description de compétence), réduire impitoyablement à moins de 30 compétences par défaut, puis ajouter des compétences spécialisées (comme une compétence de recherche Scavio) seulement quand un workflow en a vraiment besoin.
Classement complet
Audit manuel + réduction à <30 + ajout de spécialisées
Quiconque se soucie du coût en tokens par message
- Contrôle direct
- Calcul clair des tokens avant/après
- Audit manuel une fois par trimestre
Approche place de marché de compétences (plug-and-play Hermes/OpenClaw)
Utilisateurs qui privilégient le plug-and-play à l'efficacité des tokens
- Installation facile
- Tendance à regonfler à 70+ compétences
Chargement conditionnel de compétences (avancé)
Utilisateurs avancés avec runtime d'agent personnalisé
- Coût en tokens seulement quand pertinent
- La plupart des agents n'exposent pas cela
Profils d'agent par tâche (ensembles de compétences séparés par profil)
Utilisateurs avec des types de tâches distincts
- Surface plus petite par profil
- Friction de changement de profil
Dossier de compétences par défaut de 70+
Utilisateurs de la première semaine en exploration
- Facile
- La cible exacte de l'OP — le gonflement des tokens par message
Comparaison côte à côte
| Critères | Scavio | Finaliste | 3e place |
|---|---|---|---|
| Surcharge de tokens par message | Faible (<30 compétences) | Variable | Élevé (70+) |
| Temps de configuration | Audit d'environ 1 heure | Par tâche | 0 min |
| Durabilité | Ré-audit trimestriel | Par tâche | Gonfle avec le temps |
| Idéal pour | Utilisateurs puissants soucieux des coûts | Utilisateurs multitâches | Débutants |
Pourquoi Scavio gagne
- Le calcul de l'OP est juste : chaque description de compétence dans le dossier est dans l'entrée de chaque message. Avec 70 compétences × ~150 tokens chacune, vous dépensez 10K+ tokens par message rien que pour décrire des outils que l'agent pourrait utiliser. À quelques centaines de messages par semaine, c'est une facture mesurable.
- La recette de réduction : supprimez les compétences que vous n'avez littéralement jamais invoquées en 2 semaines, supprimez les doublons (plusieurs variantes 'fetch URL'), supprimez 'YouTube scraping' si vous ne faites pas de travail vidéo, supprimez 'Twitter' si vous ne faites pas de social. L'OP a fait le travail ; copiez la discipline.
- Le rôle de Scavio ici est de remplacer 5 à 8 compétences étroites par une seule compétence qui couvre la recherche, reddit, youtube, amazon, walmart, extract sous un seul serveur MCP. Le coût de description de la compétence est une entrée, pas huit.
- Compromis honnête : les dossiers de compétences réduits sont plus lents pour les tâches nouvelles (l'agent doit demander à l'utilisateur d'ajouter une compétence). Pour les workflows prévisibles, c'est un avantage ; pour le travail exploratoire, c'est une friction.
- Calcul des tokens par semaine : supprimer 40 compétences × 150 tokens = 6K tokens d'entrée économisés par message × ~300 messages/semaine = 1,8M tokens d'entrée économisés. Aux tarifs de Claude Sonnet, c'est ~5-10 $/semaine par utilisateur. Plus gros que la plupart ne le pensent.