Arrêtez de brûler des tokens Claude sur le HTML (2026)

Un post sur r/ClaudeAI a lancé PullMD pour corriger le gonflement des tokens HTML dans Claude Code. La même correction fonctionne via l'endpoint /extract de Scavio sans infrastructure. Ce tutoriel explique la substitution.

Prérequis

Claude Code installé
Clé API Scavio

Parcours

Étape 1: Identifier le HTML qui brûle des tokens dans l'agent actuel

Rechercher les appels d'outils qui récupèrent du HTML brut et le transmettent au LLM.

Python

# Before:
# fetch(url) -> raw HTML -> LLM context
# 60KB HTML = ~30K tokens

Étape 2: Attacher Scavio MCP

Une ligne de configuration dans Claude Code.

Bash

claude mcp add scavio https://mcp.scavio.dev/mcp --header "x-api-key: $SCAVIO_API_KEY"

Étape 3: Remplacer l'outil fetch par l'outil extract MCP

L'agent appelle extract(url) au lieu de fetch.

Python

# Agent prompt now uses extract tool:
# 'Use extract to read the markdown of $URL'
# Returns ~3K tokens of clean markdown.

Étape 4: Exécuter le comptage de tokens avant/après

Comparer l'utilisation des tokens sur la même tâche.

Text

# Before: 30K input tokens / call
# After:  3K input tokens / call
# 10x reduction at the input layer.

Étape 5: Décider du coût par appel

Scavio extract coûte 1 crédit / appel. PullMD auto-hébergé est gratuit + votre infrastructure.

Text

# Scavio: $0.0043/call hosted
# PullMD: $0/call + server you maintain
# Pick based on infra preference.

Exemple Python

Python

# Direct API alternative if not using MCP:
import os, requests
resp = requests.post('https://api.scavio.dev/api/v1/extract',
    headers={'x-api-key': os.environ['SCAVIO_API_KEY']},
    json={'url': url, 'format': 'markdown'}).json()
markdown = resp.get('markdown', '')

Exemple JavaScript

JavaScript

// Same shape in TS.
const resp = await fetch('https://api.scavio.dev/api/v1/extract', {
  method: 'POST',
  headers: { 'x-api-key': process.env.SCAVIO_API_KEY, 'Content-Type': 'application/json' },
  body: JSON.stringify({ url, format: 'markdown' })
}).then(r => r.json());

Sortie attendue

JSON

Claude Code agent's HTML-related tool calls drop from ~30K input tokens to ~3K. Per-task LLM cost drops accordingly.

Tutoriels associés

Questions fréquentes

La plupart des développeurs terminent ce tutoriel en 15 à 30 minutes. Vous aurez besoin d'une clé API Scavio (l'offre gratuite suffit) et d'un environnement Python ou JavaScript fonctionnel.

Claude Code installé. Clé API Scavio. Une clé API Scavio vous donne 50 crédits gratuits à l'inscription.

Oui. L'offre gratuite comprend 50 crédits à l'inscription, ce qui est largement suffisant pour terminer ce tutoriel et prototyper une solution fonctionnelle.

Scavio dispose d'un package natif LangChain (langchain-scavio), d'un serveur MCP et d'une API REST simple qui fonctionne avec tout client HTTP. Ce tutoriel utilise the raw REST API, mais vous pouvez l'adapter à votre framework de prédilection.

Parcours

Étape 1: Identifier le HTML qui brûle des tokens dans l'agent actuel

Rechercher les appels d'outils qui récupèrent du HTML brut et le transmettent au LLM.

Python

# Before:
# fetch(url) -> raw HTML -> LLM context
# 60KB HTML = ~30K tokens

Étape 2: Attacher Scavio MCP

Une ligne de configuration dans Claude Code.

Bash

claude mcp add scavio https://mcp.scavio.dev/mcp --header "x-api-key: $SCAVIO_API_KEY"

Étape 3: Remplacer l'outil fetch par l'outil extract MCP

L'agent appelle extract(url) au lieu de fetch.

Python

# Agent prompt now uses extract tool:
# 'Use extract to read the markdown of $URL'
# Returns ~3K tokens of clean markdown.

Étape 4: Exécuter le comptage de tokens avant/après

Comparer l'utilisation des tokens sur la même tâche.

Text

# Before: 30K input tokens / call
# After:  3K input tokens / call
# 10x reduction at the input layer.

Étape 5: Décider du coût par appel

Scavio extract coûte 1 crédit / appel. PullMD auto-hébergé est gratuit + votre infrastructure.

Text

# Scavio: $0.0043/call hosted
# PullMD: $0/call + server you maintain
# Pick based on infra preference.

# Direct API alternative if not using MCP: import os, requests resp = requests.post('https://api.scavio.dev/api/v1/extract', headers={'x-api-key': os.environ['SCAVIO_API_KEY']}, json={'url': url, 'format': 'markdown'}).json() markdown = resp.get('markdown', '')

// Same shape in TS. const resp = await fetch('https://api.scavio.dev/api/v1/extract', { method: 'POST', headers: { 'x-api-key': process.env.SCAVIO_API_KEY, 'Content-Type': 'application/json' }, body: JSON.stringify({ url, format: 'markdown' }) }).then(r => r.json());

Questions fréquentes

La plupart des développeurs terminent ce tutoriel en 15 à 30 minutes. Vous aurez besoin d'une clé API Scavio (l'offre gratuite suffit) et d'un environnement Python ou JavaScript fonctionnel.

Claude Code installé. Clé API Scavio. Une clé API Scavio vous donne 50 crédits gratuits à l'inscription.

Oui. L'offre gratuite comprend 50 crédits à l'inscription, ce qui est largement suffisant pour terminer ce tutoriel et prototyper une solution fonctionnelle.

Comment arrêter de brûler des tokens Claude Code sur le parsing HTML

Prérequis

Parcours

Étape 1: Identifier le HTML qui brûle des tokens dans l'agent actuel

Étape 2: Attacher Scavio MCP

Étape 3: Remplacer l'outil fetch par l'outil extract MCP

Étape 4: Exécuter le comptage de tokens avant/après

Étape 5: Décider du coût par appel

Exemple Python

Exemple JavaScript

Sortie attendue

Tutoriels associés

Questions fréquentes

Combien de temps dure ce tutoriel comment arrêter de brûler des tokens claude code sur le parsing html ?

De quoi ai-je besoin avant de commencer ?

Puis-je suivre ce tutoriel avec l'offre gratuite ?

Avec quels frameworks cela fonctionne-t-il ?

Ressources connexes

Optimisation des jetons HTML de Claude Code

Meilleurs outils d'extraction HTML MCP en 2026

Stack d’économie de jetons HTML pour Claude Code

Stack MCP des coûts de tokens Claude Code

PullMD vs Scavio /extract

Coût des tokens HTML

Commencer

Comment arrêter de brûler des tokens Claude Code sur le parsing HTML

Prérequis

Parcours

Étape 1: Identifier le HTML qui brûle des tokens dans l'agent actuel

Étape 2: Attacher Scavio MCP

Étape 3: Remplacer l'outil fetch par l'outil extract MCP

Étape 4: Exécuter le comptage de tokens avant/après

Étape 5: Décider du coût par appel

Exemple Python

Exemple JavaScript

Sortie attendue

Tutoriels associés

Questions fréquentes

Combien de temps dure ce tutoriel comment arrêter de brûler des tokens claude code sur le parsing html ?

De quoi ai-je besoin avant de commencer ?

Puis-je suivre ce tutoriel avec l'offre gratuite ?

Avec quels frameworks cela fonctionne-t-il ?

Ressources connexes

Optimisation des jetons HTML de Claude Code

Meilleurs outils d'extraction HTML MCP en 2026

Stack d’économie de jetons HTML pour Claude Code

Stack MCP des coûts de tokens Claude Code

PullMD vs Scavio /extract

Coût des tokens HTML

Commencer