Définition
Le coût des tokens HTML est le coût d'entrée LLM lié à l'injection de HTML brut dans une fenêtre de contexte par rapport à un format plus propre comme le markdown ; une page HTML de 60KB utilise en moyenne environ 30K tokens bruts contre 3K tokens en markdown, donc tout agent qui traite des pages web sans étape de conversion HTML vers markdown paie environ 10x en tokens d'entrée.
En profondeur
Le coût des tokens HTML est apparu comme un point de friction récurrent dans les fils r/ClaudeAI en 2026. La solution est une étape de conversion en markdown avant que le LLM ne voie la page : PullMD (OSS, auto-hébergé), l'endpoint /extract de Scavio (hébergé, $0.0043/extraction), ou le mode scrape de Firecrawl (par crédit, évolutif). Le calcul derrière le facteur 10 : le HTML contient en moyenne 5 à 10 octets de code standard par octet de contenu (balises script, CSS en ligne, navigation, pied de page, balisage publicitaire), et les tokeniseurs comptent chacun séparément. Réduire au contenu sémantique avec des en-têtes et des liens markdown maintient le contexte LLM ciblé. Contrainte honnête : le coût des tokens n'est qu'une moitié de l'équation ; si l'agent doit interagir avec la page (clic, remplissage de formulaire), le markdown perd la surface d'interaction et un vrai navigateur est nécessaire.
Exemple d'utilisation
Passer l'outil de récupération web de l'agent Claude Code du HTML brut à Scavio /extract markdown a réduit les tokens d'entrée moyens par tâche de ~30K à ~3K, diminuant le coût LLM par tâche d'un ordre de grandeur.
Plateformes
Coût des tokens HTML est pertinent sur les plateformes suivantes, toutes accessibles via l'API unifiée de Scavio :
Termes associés
API de recherche multiplateforme
Une API de recherche multiplateforme est un point de terminaison REST unique qui renvoie du JSON structuré depuis plusie...
Sortie de recherche structurée
La sortie de recherche structurée est le JSON typé retourné par une API de recherche — titre, extrait, lien, position, h...
Architecture d'agent
L'architecture d'agent est l'ensemble des choix de conception qui transforment une invite LLM en un système de productio...