Combien de temps dure ce tutoriel comment récupérer des données de recherche web sans gérer les proxies ?

La plupart des développeurs terminent ce tutoriel en 15 à 30 minutes. Vous aurez besoin d'une clé API Scavio (l'offre gratuite suffit) et d'un environnement Python ou JavaScript fonctionnel.

De quoi ai-je besoin avant de commencer ?

Python 3.8 ou supérieur. bibliothèque requests installée. Une clé API Scavio. Compréhension de base des requêtes HTTP. Une clé API Scavio vous donne 50 crédits gratuits à l'inscription.

Puis-je suivre ce tutoriel avec l'offre gratuite ?

Oui. L'offre gratuite comprend 50 crédits à l'inscription, ce qui est largement suffisant pour terminer ce tutoriel et prototyper une solution fonctionnelle.

Avec quels frameworks cela fonctionne-t-il ?

Scavio dispose d'un package natif LangChain (langchain-scavio), d'un serveur MCP et d'une API REST simple qui fonctionne avec tout client HTTP. Ce tutoriel utilise the raw REST API, mais vous pouvez l'adapter à votre framework de prédilection.

API de récupération de données de recherche web sans proxies (2026)

Construire un scraper web direct nécessite de gérer un pool de proxies rotatifs, de résoudre des CAPTCHAs, de gérer le rendu JavaScript et d'analyser du HTML brut — tout cela demande un effort d'ingénierie important et une maintenance continue. L'API Scavio est un service de données de recherche géré qui prend en charge toute cette infrastructure côté serveur. Vous effectuez une seule requête HTTP POST authentifiée et recevez du JSON structuré. Ce tutoriel compare l'approche traditionnelle basée sur les proxies à l'approche Scavio et montre comment migrer d'un scraper vers l'API.

Prérequis

Python 3.8 ou supérieur
bibliothèque requests installée
Une clé API Scavio
Compréhension de base des requêtes HTTP

Parcours

Étape 1: L'approche de scraping traditionnelle (avant)

Un scraper typique nécessite une configuration de proxy, une rotation des user-agents et une analyse HTML — tout cela susceptible de se casser lorsque les sites changent.

Python

# Traditional approach — fragile and requires proxy infrastructure
import requests
from bs4 import BeautifulSoup

proxies = {"http": "http://user:pass@proxy:8080", "https": "http://user:pass@proxy:8080"}
headers = {"User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64)..."}
response = requests.get("https://www.google.com/search?q=python+tutorial",
                        proxies=proxies, headers=headers)
soup = BeautifulSoup(response.text, "html.parser")
# Fragile: class names change without notice
results = soup.find_all("div", class_="tF2Cxc")

Étape 2: L'approche Scavio (après)

Remplacez le scraper par un seul appel API. Pas de proxies, pas d'analyse HTML, pas de maintenance.

Python

# Scavio approach — stable, structured, no infrastructure
import requests

response = requests.post(
    "https://api.scavio.dev/api/v1/search",
    headers={"x-api-key": "your_scavio_api_key"},
    json={"query": "python tutorial", "country_code": "us"}
)
results = response.json()["organic_results"]

Étape 3: Gérer les tentatives avec backoff exponentiel

L'API Scavio est fiable, mais ajoutez un simple wrapper de tentative pour les erreurs réseau.

Python

import time

def search_with_retry(query: str, max_retries: int = 3) -> dict:
    for attempt in range(max_retries):
        try:
            r = requests.post(ENDPOINT, headers={"x-api-key": API_KEY},
                              json={"query": query, "country_code": "us"}, timeout=30)
            r.raise_for_status()
            return r.json()
        except requests.RequestException as e:
            if attempt == max_retries - 1:
                raise
            time.sleep(2 ** attempt)
    return {}

Étape 4: Valider le schéma de réponse

Ajoutez une simple vérification de schéma pour garantir que la réponse contient les champs attendus avant le traitement.

Python

def validate_response(data: dict) -> bool:
    required = ["organic_results"]
    return all(k in data for k in required)

data = search_with_retry("python tutorial")
if validate_response(data):
    for r in data["organic_results"][:5]:
        print(r["title"], r["link"])

Exemple Python

Python

import os
import time
import requests

API_KEY = os.environ.get("SCAVIO_API_KEY", "your_scavio_api_key")
ENDPOINT = "https://api.scavio.dev/api/v1/search"

def search(query: str, retries: int = 3) -> dict:
    for i in range(retries):
        try:
            r = requests.post(ENDPOINT, headers={"x-api-key": API_KEY},
                              json={"query": query, "country_code": "us"}, timeout=30)
            r.raise_for_status()
            return r.json()
        except requests.RequestException:
            if i < retries - 1:
                time.sleep(2 ** i)
            else:
                raise
    return {}

if __name__ == "__main__":
    # No proxies, no HTML parsing, no CAPTCHA solving
    data = search("python tutorial")
    for r in data.get("organic_results", [])[:5]:
        print(f"{r['title']}\n{r['link']}\n")

Exemple JavaScript

JavaScript

const API_KEY = process.env.SCAVIO_API_KEY || "your_scavio_api_key";
const ENDPOINT = "https://api.scavio.dev/api/v1/search";

async function search(query, retries = 3) {
  for (let i = 0; i < retries; i++) {
    try {
      const res = await fetch(ENDPOINT, {
        method: "POST",
        headers: { "x-api-key": API_KEY, "Content-Type": "application/json" },
        body: JSON.stringify({ query, country_code: "us" })
      });
      if (!res.ok) throw new Error(`HTTP ${res.status}`);
      return res.json();
    } catch (e) {
      if (i === retries - 1) throw e;
      await new Promise(r => setTimeout(r, Math.pow(2, i) * 1000));
    }
  }
}

// No proxies, no HTML parsing
search("python tutorial").then(data => {
  (data.organic_results || []).slice(0, 5).forEach(r => console.log(`${r.title}\n${r.link}\n`));
}).catch(console.error);

Sortie attendue

JSON

Traditional approach: 47 lines, 3 dependencies, breaks monthly

Scavio approach: 8 lines, 1 dependency, stable

Sample output:
{
  "organic_results": [
    { "position": 1, "title": "Python Tutorial — W3Schools", "link": "https://w3schools.com/python/" },
    { "position": 2, "title": "The Python Tutorial — Python Docs", "link": "https://docs.python.org/tutorial/" }
  ]
}

Tutoriels associés

Prérequis

Python 3.8 ou supérieur
bibliothèque requests installée
Une clé API Scavio
Compréhension de base des requêtes HTTP

Parcours

Étape 1: L'approche de scraping traditionnelle (avant)

Un scraper typique nécessite une configuration de proxy, une rotation des user-agents et une analyse HTML — tout cela susceptible de se casser lorsque les sites changent.

Python

# Traditional approach — fragile and requires proxy infrastructure
import requests
from bs4 import BeautifulSoup

proxies = {"http": "http://user:pass@proxy:8080", "https": "http://user:pass@proxy:8080"}
headers = {"User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64)..."}
response = requests.get("https://www.google.com/search?q=python+tutorial",
                        proxies=proxies, headers=headers)
soup = BeautifulSoup(response.text, "html.parser")
# Fragile: class names change without notice
results = soup.find_all("div", class_="tF2Cxc")

Étape 2: L'approche Scavio (après)

Remplacez le scraper par un seul appel API. Pas de proxies, pas d'analyse HTML, pas de maintenance.

Python

# Scavio approach — stable, structured, no infrastructure
import requests

response = requests.post(
    "https://api.scavio.dev/api/v1/search",
    headers={"x-api-key": "your_scavio_api_key"},
    json={"query": "python tutorial", "country_code": "us"}
)
results = response.json()["organic_results"]

Étape 3: Gérer les tentatives avec backoff exponentiel

L'API Scavio est fiable, mais ajoutez un simple wrapper de tentative pour les erreurs réseau.

Python

import time

def search_with_retry(query: str, max_retries: int = 3) -> dict:
    for attempt in range(max_retries):
        try:
            r = requests.post(ENDPOINT, headers={"x-api-key": API_KEY},
                              json={"query": query, "country_code": "us"}, timeout=30)
            r.raise_for_status()
            return r.json()
        except requests.RequestException as e:
            if attempt == max_retries - 1:
                raise
            time.sleep(2 ** attempt)
    return {}

Étape 4: Valider le schéma de réponse

Ajoutez une simple vérification de schéma pour garantir que la réponse contient les champs attendus avant le traitement.

Python

def validate_response(data: dict) -> bool:
    required = ["organic_results"]
    return all(k in data for k in required)

data = search_with_retry("python tutorial")
if validate_response(data):
    for r in data["organic_results"][:5]:
        print(r["title"], r["link"])

Exemple Python

Python

import os
import time
import requests

API_KEY = os.environ.get("SCAVIO_API_KEY", "your_scavio_api_key")
ENDPOINT = "https://api.scavio.dev/api/v1/search"

def search(query: str, retries: int = 3) -> dict:
    for i in range(retries):
        try:
            r = requests.post(ENDPOINT, headers={"x-api-key": API_KEY},
                              json={"query": query, "country_code": "us"}, timeout=30)
            r.raise_for_status()
            return r.json()
        except requests.RequestException:
            if i < retries - 1:
                time.sleep(2 ** i)
            else:
                raise
    return {}

if __name__ == "__main__":
    # No proxies, no HTML parsing, no CAPTCHA solving
    data = search("python tutorial")
    for r in data.get("organic_results", [])[:5]:
        print(f"{r['title']}\n{r['link']}\n")

Exemple JavaScript

JavaScript

const API_KEY = process.env.SCAVIO_API_KEY || "your_scavio_api_key";
const ENDPOINT = "https://api.scavio.dev/api/v1/search";

async function search(query, retries = 3) {
  for (let i = 0; i < retries; i++) {
    try {
      const res = await fetch(ENDPOINT, {
        method: "POST",
        headers: { "x-api-key": API_KEY, "Content-Type": "application/json" },
        body: JSON.stringify({ query, country_code: "us" })
      });
      if (!res.ok) throw new Error(`HTTP ${res.status}`);
      return res.json();
    } catch (e) {
      if (i === retries - 1) throw e;
      await new Promise(r => setTimeout(r, Math.pow(2, i) * 1000));
    }
  }
}

// No proxies, no HTML parsing
search("python tutorial").then(data => {
  (data.organic_results || []).slice(0, 5).forEach(r => console.log(`${r.title}\n${r.link}\n`));
}).catch(console.error);

Sortie attendue

JSON

Traditional approach: 47 lines, 3 dependencies, breaks monthly

Scavio approach: 8 lines, 1 dependency, stable

Sample output:
{
  "organic_results": [
    { "position": 1, "title": "Python Tutorial — W3Schools", "link": "https://w3schools.com/python/" },
    { "position": 2, "title": "The Python Tutorial — Python Docs", "link": "https://docs.python.org/tutorial/" }
  ]
}

Comment récupérer des données de recherche web sans gérer les proxies

Prérequis

Parcours

Étape 1: L'approche de scraping traditionnelle (avant)

Étape 2: L'approche Scavio (après)

Étape 3: Gérer les tentatives avec backoff exponentiel

Étape 4: Valider le schéma de réponse

Exemple Python

Exemple JavaScript

Sortie attendue

Tutoriels associés

Questions fréquentes

Combien de temps dure ce tutoriel comment récupérer des données de recherche web sans gérer les proxies ?

De quoi ai-je besoin avant de commencer ?

Puis-je suivre ce tutoriel avec l'offre gratuite ?

Avec quels frameworks cela fonctionne-t-il ?

Ressources connexes

Meilleures API de recherche pour agents avec offres gratuites (2026)

Comparaison des meilleurs niveaux d'API de recherche gratuits : mai 2026

Comparaison des niveaux gratuits d'API de recherche

Ère du Paywall de Recherche (2026)

Search APIs (Scavio, Tavily, SerpAPI) vs Headless Browser (Playwright, Puppeteer, Browserbase)

Workflow d'enrichissement de recherche n8n

Commencer

Comment récupérer des données de recherche web sans gérer les proxies

Prérequis

Parcours

Étape 1: L'approche de scraping traditionnelle (avant)

Étape 2: L'approche Scavio (après)

Étape 3: Gérer les tentatives avec backoff exponentiel

Étape 4: Valider le schéma de réponse

Exemple Python

Exemple JavaScript

Sortie attendue

Tutoriels associés

Questions fréquentes

Combien de temps dure ce tutoriel comment récupérer des données de recherche web sans gérer les proxies ?

De quoi ai-je besoin avant de commencer ?

Puis-je suivre ce tutoriel avec l'offre gratuite ?

Avec quels frameworks cela fonctionne-t-il ?

Ressources connexes

Meilleures API de recherche pour agents avec offres gratuites (2026)

Comparaison des meilleurs niveaux d'API de recherche gratuits : mai 2026

Comparaison des niveaux gratuits d'API de recherche

Ère du Paywall de Recherche (2026)

Search APIs (Scavio, Tavily, SerpAPI) vs Headless Browser (Playwright, Puppeteer, Browserbase)

Workflow d'enrichissement de recherche n8n

Commencer