Construire un serveur MCP pour l'extraction HTML (2026)

Un post sur r/ClaudeAI a lancé PullMD : un serveur MCP pour l'extraction HTML vers markdown. Ce tutoriel présente deux approches — hébergé (Scavio MCP) et auto-hébergé (FastMCP encapsulant l'extraction Scavio).

Prérequis

Python 3.10+ pour l'auto-hébergement
Claude Code ou tout client MCP

Parcours

Étape 1: Voie A : Utiliser le MCP hébergé de Scavio

Zéro infrastructure.

Bash

claude mcp add scavio https://mcp.scavio.dev/mcp --header "x-api-key: $SCAVIO_API_KEY"

Étape 2: Voie B : Auto-hébergement avec FastMCP

Installer fastmcp.

Bash

pip install fastmcp requests

Étape 3: Encapsuler l'extraction Scavio

Serveur FastMCP exposant l'outil d'extraction.

Python

import os, requests
from fastmcp import FastMCP

mcp = FastMCP('html-extractor')

@mcp.tool()
def extract(url: str) -> dict:
    return requests.post('https://api.scavio.dev/api/v1/extract',
        headers={'x-api-key': os.environ['SCAVIO_API_KEY']},
        json={'url': url, 'format': 'markdown'}).json()

if __name__ == '__main__':
    mcp.run()

Étape 4: Exécuter localement

Écouter sur stdio ou SSE.

Bash

python server.py

Étape 5: Attacher à Claude Code

Configuration MCP personnalisée.

Bash

claude mcp add html-extractor python /path/to/server.py

Exemple Python

Python

# Path A is hosted, simplest, $0.0043/extract.
# Path B is self-hosted, $0/extract apart from Scavio underneath.

Exemple JavaScript

JavaScript

// Same in TS using @modelcontextprotocol/sdk.

Sortie attendue

JSON

Claude Code agent has a clean extract tool that returns markdown for any URL. Token usage drops 10x versus passing raw HTML.

Tutoriels associés

Comment arrêter de brûler des tokens Claude Code sur le parsing HTML

Questions fréquentes

La plupart des développeurs terminent ce tutoriel en 15 à 30 minutes. Vous aurez besoin d'une clé API Scavio (l'offre gratuite suffit) et d'un environnement Python ou JavaScript fonctionnel.

Python 3.10+ pour l'auto-hébergement. Claude Code ou tout client MCP. Une clé API Scavio vous donne 50 crédits gratuits à l'inscription.

Oui. L'offre gratuite comprend 50 crédits à l'inscription, ce qui est largement suffisant pour terminer ce tutoriel et prototyper une solution fonctionnelle.

Scavio dispose d'un package natif LangChain (langchain-scavio), d'un serveur MCP et d'une API REST simple qui fonctionne avec tout client HTTP. Ce tutoriel utilise the raw REST API, mais vous pouvez l'adapter à votre framework de prédilection.

Parcours

Étape 1: Voie A : Utiliser le MCP hébergé de Scavio

Zéro infrastructure.

Bash

claude mcp add scavio https://mcp.scavio.dev/mcp --header "x-api-key: $SCAVIO_API_KEY"

Étape 2: Voie B : Auto-hébergement avec FastMCP

Installer fastmcp.

Bash

pip install fastmcp requests

Étape 3: Encapsuler l'extraction Scavio

Serveur FastMCP exposant l'outil d'extraction.

Python

import os, requests
from fastmcp import FastMCP

mcp = FastMCP('html-extractor')

@mcp.tool()
def extract(url: str) -> dict:
    return requests.post('https://api.scavio.dev/api/v1/extract',
        headers={'x-api-key': os.environ['SCAVIO_API_KEY']},
        json={'url': url, 'format': 'markdown'}).json()

if __name__ == '__main__':
    mcp.run()

Étape 4: Exécuter localement

Écouter sur stdio ou SSE.

Bash

python server.py

Étape 5: Attacher à Claude Code

Configuration MCP personnalisée.

Bash

claude mcp add html-extractor python /path/to/server.py

Questions fréquentes

La plupart des développeurs terminent ce tutoriel en 15 à 30 minutes. Vous aurez besoin d'une clé API Scavio (l'offre gratuite suffit) et d'un environnement Python ou JavaScript fonctionnel.

Python 3.10+ pour l'auto-hébergement. Claude Code ou tout client MCP. Une clé API Scavio vous donne 50 crédits gratuits à l'inscription.

Oui. L'offre gratuite comprend 50 crédits à l'inscription, ce qui est largement suffisant pour terminer ce tutoriel et prototyper une solution fonctionnelle.

Comment construire un serveur MCP pour l'extraction HTML

Prérequis

Parcours

Étape 1: Voie A : Utiliser le MCP hébergé de Scavio

Étape 2: Voie B : Auto-hébergement avec FastMCP

Étape 3: Encapsuler l'extraction Scavio

Étape 4: Exécuter localement

Étape 5: Attacher à Claude Code

Exemple Python

Exemple JavaScript

Sortie attendue

Tutoriels associés

Questions fréquentes

Combien de temps dure ce tutoriel comment construire un serveur mcp pour l'extraction html ?

De quoi ai-je besoin avant de commencer ?

Puis-je suivre ce tutoriel avec l'offre gratuite ?

Avec quels frameworks cela fonctionne-t-il ?

Ressources connexes

Serveur de recherche personnalisé MCP

Meilleurs outils de recherche MCP pour Claude Code en 2026

Meilleurs serveurs de recherche MCP pour Claude Code en 2026

Optimisation des jetons HTML de Claude Code

PullMD vs Scavio /extract

Tavily vs Scavio

Commencer

Comment construire un serveur MCP pour l'extraction HTML

Prérequis

Parcours

Étape 1: Voie A : Utiliser le MCP hébergé de Scavio

Étape 2: Voie B : Auto-hébergement avec FastMCP

Étape 3: Encapsuler l'extraction Scavio

Étape 4: Exécuter localement

Étape 5: Attacher à Claude Code

Exemple Python

Exemple JavaScript

Sortie attendue

Tutoriels associés

Questions fréquentes

Combien de temps dure ce tutoriel comment construire un serveur mcp pour l'extraction html ?

De quoi ai-je besoin avant de commencer ?

Puis-je suivre ce tutoriel avec l'offre gratuite ?

Avec quels frameworks cela fonctionne-t-il ?

Ressources connexes

Serveur de recherche personnalisé MCP

Meilleurs outils de recherche MCP pour Claude Code en 2026

Meilleurs serveurs de recherche MCP pour Claude Code en 2026

Optimisation des jetons HTML de Claude Code

PullMD vs Scavio /extract

Tavily vs Scavio

Commencer