Google contient des données précieuses -- organic results, knowledge graph, People Also Ask, AI overview, et plus encore. Gratter ces données directement implique de faire face à la détection anti-bot, aux CAPTCHAs, à la rotation d'IP et à des sélecteurs qui se cassent constamment. L'API Scavio gère tout cela et renvoie un JSON propre et structuré à partir d'une seule requête POST.
Ce tutoriel vous montre comment gratter Google en utilisant Python et l'API Scavio. À la fin, vous aurez un script Python fonctionnel qui récupère les données en temps réel de Google et analyse les résultats.
Prérequis
- Python installé sur votre machine
- Une clé API Scavio (free tier comprend 250 crédits/mois -- aucune carte bancaire requise)
Étape 1 : Installer les dépendances
Installez requests pour effectuer des requêtes HTTP :
pip install requestsÉtape 2 : Effectuer votre première recherche Google
Envoyez une requête POST à l'endpoint API Scavio Google avec votre requête. L'API renvoie un JSON structuré avec organic results, knowledge graph, People Also Ask et plus encore.
import requests
API_KEY = "your_scavio_api_key"
response = requests.post(
"https://api.scavio.dev/api/v1/search",
headers={
"x-api-key": API_KEY,
"Content-Type": "application/json",
},
json={"query": query},
)
data = response.json()
for result in data.get("organic_results", [])[:5]:
print(f"{result['position']}. {result['title']}")
print(f" {result['link']}\n")Étape 3 : Exemple de réponse
L'API renvoie un JSON structuré. Voici un exemple de réponse pour une recherche Google :
{
"search_metadata": {
"status": "success",
"total_results": 1240000000
},
"organic_results": [
{
"position": 1,
"title": "Best Noise-Cancelling Headphones of 2026",
"link": "https://example.com/best-headphones",
"snippet": "We tested 30+ headphones to find the best...",
"displayed_link": "example.com"
}
],
"knowledge_graph": {
"title": "Noise-cancelling headphones",
"description": "Active noise-cancelling headphones use..."
},
"people_also_ask": [
{ "question": "What are the best noise cancelling headphones right now?" },
{ "question": "Is noise cancelling bad for your ears?" }
]
}Chaque champ est structuré et typé -- pas d'analyse HTML, pas de sélecteurs CSS, pas d'extraction par regex. Votre code Python peut accéder directement à n'importe quel champ.
Étape 4 : Exemple complet fonctionnel
Voici un script Python complet et exécutable qui recherche Google et affiche les résultats :
"""
Scrape Google search results using Scavio API.
Returns structured JSON with organic results, knowledge graph, People Also Ask, and more.
"""
import requests
import json
API_KEY = "your_scavio_api_key"
def search_google(query: str) -> dict:
response = requests.post(
"https://api.scavio.dev/api/v1/search",
headers={
"x-api-key": API_KEY,
"Content-Type": "application/json",
},
json={"query": query},
)
response.raise_for_status()
return response.json()
if __name__ == "__main__":
results = search_google("best noise cancelling headphones 2026")
print(json.dumps(results, indent=2))Pourquoi utiliser Scavio plutôt que de gratter Google directement ?
- Pas de gestion de proxy. Le grattage direct nécessite des proxies tournants pour éviter les bannissements IP. Scavio gère tout cela côté serveur.
- Pas de résolution de CAPTCHA. Google bloque agressivement les requêtes automatisées. Scavio renvoie des données propres à chaque fois.
- Sortie JSON structurée. Pas d'analyse HTML ni de maintenance de sélecteurs CSS. Obtenez des données typées et cohérentes à chaque requête.
- Multi-plateforme dans une seule API. Recherchez sur Google, Amazon, YouTube et Walmart avec la même clé API et le même modèle d'authentification.
- Niveau gratuit inclus. 250 crédits/mois sans carte bancaire requise. Chaque recherche coûte 1 crédit.