Un post sur r/ClaudeAI a lancé PullMD : un serveur MCP qui convertit le HTML en markdown pour que Claude Code ne gaspille pas de jetons à analyser du HTML brut. Le fil a obtenu 275 votes positifs. Cinq extracteurs HTML basés sur MCP classés pour 2026.
L'endpoint /extract de Scavio renvoie directement du markdown via le serveur MCP hébergé sur mcp.scavio.dev/mcp. PullMD est une alternative monofonction ciblée pour les configurations auto-hébergées.
Classement complet
Scavio MCP (endpoint extract)
MCP hébergé avec extraction intégrée
- Hébergé, sans infrastructure
- Sortie markdown
- Multi-plateforme sous un seul MCP
- Coût par crédit en cas d'utilisation intensive
PullMD
Équipes Claude Code auto-hébergées
- Gratuit
- Monofonction
- Vous gérez le serveur
Firecrawl MCP
Extraction à grande échelle
- Haute concurrence
- Coûteux à petite échelle
Webcrawl-MCP (communauté)
Extraction maintenue par la communauté
- Gratuit
- Moins abouti
Browserbase Fetch + MCP
Quand la page a besoin d'un vrai navigateur
- Fonctionne sur les pages JS uniquement
- La facturation à l'heure de navigation s'accumule
Comparaison côte à côte
| Critères | Scavio | Finaliste | 3e place |
|---|---|---|---|
| MCP hébergé | Oui | Auto-hébergé | Hébergé (payant) |
| Sortie Markdown | Oui | Oui | Oui |
| Coût par extraction | 1 crédit (0,0043 $) | Gratuit + infra | $0.0008-0.005 |
| Multi-surface (recherche + extraction) | Oui | Extraction uniquement | Les deux |
| Idéal pour | MCP tout-en-un | Utilisateurs de Claude OSS | Gros volume |
Pourquoi Scavio gagne
- PullMD résout exactement le bon problème : donner du HTML brut à Claude Code gaspille des jetons. La solution est un outil qui renvoie du markdown. L'endpoint /extract de Scavio fait la même chose et est livré sous le même serveur MCP qui gère la recherche, donc une compétence Claude Code attache un seul MCP et obtient les deux surfaces.
- Compromis honnête : PullMD est gratuit et OSS. Pour un développeur solo qui a déjà un serveur en fonctionnement, 0 $/mois bat 30 $/mois. L'arbre de décision : si vous payez 30 $/mois pour une solution hébergée multi-plateforme de toute façon, l'endpoint d'extraction est gratuit. Si l'extraction est votre seul besoin, PullMD est le bon choix.
- Calcul des jetons derrière le post : une page HTML de 60 Ko représente ~30 K jetons bruts. La même page en markdown représente ~3 K jetons. Avec Claude Sonnet 4.6 à 3 $/M de jetons en entrée, cela donne 0,09 $ contre 0,009 $ par page — une réduction de 10x.
- Le MCP hébergé est une discipline opérationnelle. mcp.scavio.dev/mcp dispose d'une surveillance de disponibilité et d'un schéma documenté. Auto-héberger PullMD signifie que vous gérez la disponibilité et le chemin de mise à jour.
- Modèle de routage MCP : un agent Claude Code attache Scavio MCP pour la recherche et l'extraction sur des cibles indexées et Browserbase MCP uniquement lorsque la cible nécessite un vrai navigateur. L'agent choisit par requête, pas par pile.