ScavioScavio
ProduitTarifsDocumentation
ConnexionCommencer
  1. Accueil
  2. Tutoriels
  3. Comment construire un serveur MCP pour l'extraction HTML
Tutoriel

Comment construire un serveur MCP pour l'extraction HTML

Un post sur r/ClaudeAI a lancé PullMD pour le HTML vers markdown via MCP. Le même schéma avec le point d'accès hébergé de Scavio ou votre propre serveur FastMCP.

Obtenez une clé API gratuiteDocumentation API

Un post sur r/ClaudeAI a lancé PullMD : un serveur MCP pour l'extraction HTML vers markdown. Ce tutoriel présente deux approches — hébergé (Scavio MCP) et auto-hébergé (FastMCP encapsulant l'extraction Scavio).

Prérequis

  • Python 3.10+ pour l'auto-hébergement
  • Claude Code ou tout client MCP

Parcours

Étape 1: Voie A : Utiliser le MCP hébergé de Scavio

Zéro infrastructure.

Bash
claude mcp add scavio https://mcp.scavio.dev/mcp --header "x-api-key: $SCAVIO_API_KEY"

Étape 2: Voie B : Auto-hébergement avec FastMCP

Installer fastmcp.

Bash
pip install fastmcp requests

Étape 3: Encapsuler l'extraction Scavio

Serveur FastMCP exposant l'outil d'extraction.

Python
import os, requests
from fastmcp import FastMCP

mcp = FastMCP('html-extractor')

@mcp.tool()
def extract(url: str) -> dict:
    return requests.post('https://api.scavio.dev/api/v1/extract',
        headers={'x-api-key': os.environ['SCAVIO_API_KEY']},
        json={'url': url, 'format': 'markdown'}).json()

if __name__ == '__main__':
    mcp.run()

Étape 4: Exécuter localement

Écouter sur stdio ou SSE.

Bash
python server.py

Étape 5: Attacher à Claude Code

Configuration MCP personnalisée.

Bash
claude mcp add html-extractor python /path/to/server.py

Exemple Python

Python
# Path A is hosted, simplest, $0.0043/extract.
# Path B is self-hosted, $0/extract apart from Scavio underneath.

Exemple JavaScript

JavaScript
// Same in TS using @modelcontextprotocol/sdk.

Sortie attendue

JSON
Claude Code agent has a clean extract tool that returns markdown for any URL. Token usage drops 10x versus passing raw HTML.

Tutoriels associés

  • Comment arrêter de brûler des tokens Claude Code sur le parsing HTML

Questions fréquentes

La plupart des développeurs terminent ce tutoriel en 15 à 30 minutes. Vous aurez besoin d'une clé API Scavio (l'offre gratuite suffit) et d'un environnement Python ou JavaScript fonctionnel.

Python 3.10+ pour l'auto-hébergement. Claude Code ou tout client MCP. Une clé API Scavio vous donne 50 crédits gratuits à l'inscription.

Oui. L'offre gratuite comprend 50 crédits à l'inscription, ce qui est largement suffisant pour terminer ce tutoriel et prototyper une solution fonctionnelle.

Scavio dispose d'un package natif LangChain (langchain-scavio), d'un serveur MCP et d'une API REST simple qui fonctionne avec tout client HTTP. Ce tutoriel utilise the raw REST API, mais vous pouvez l'adapter à votre framework de prédilection.

Ressources connexes

Use Case

Serveur de recherche personnalisé MCP

Read more
Best Of

Meilleurs outils de recherche MCP pour Claude Code en 2026

Read more
Best Of

Meilleurs serveurs de recherche MCP pour Claude Code en 2026

Read more
Use Case

Optimisation des jetons HTML de Claude Code

Read more
Comparison

PullMD vs Scavio /extract

Read more
Comparison

Tavily vs Scavio

Read more

Commencer

Un post sur r/ClaudeAI a lancé PullMD pour le HTML vers markdown via MCP. Le même schéma avec le point d'accès hébergé de Scavio ou votre propre serveur FastMCP.

Obtenez une clé API gratuiteLire la documentation
ScavioScavio

API de recherche en temps réel pour agents IA. Recherchez sur toutes les plateformes, pas seulement Google.

Produit

  • Fonctionnalités
  • Tarifs
  • Tableau de bord
  • Affiliés

Développeurs

  • Documentation
  • Référence API
  • Démarrage rapide
  • Intégration MCP
  • SDK Python

Alternatives

  • Alternative à Tavily
  • Alternative à SerpAPI
  • Alternative à Firecrawl
  • Alternative à Exa

Outils

  • Formateur JSON
  • cURL vers code
  • Compteur de jetons
  • Tous les outils

© 2026 Scavio. Tous droits réservés.

Featured on TAAFT
Conditions d'utilisationPolitique de confidentialité