Google contiene dati preziosi -- organic results, knowledge graph, People Also Ask, AI overview, e altro ancora. Estrarre questi dati direttamente significa dover gestire rilevamento anti-bot, CAPTCHA, rotazione IP e selettori che si rompono continuamente. L'API Scavio gestisce tutto ciò e restituisce JSON pulito e strutturato da una singola richiesta POST.
Questo tutorial mostra come estrarre dati da Google usando Python e l'API Scavio. Alla fine, avrai uno script Python funzionante che recupera dati in tempo reale da Google e analizza i risultati.
Prerequisiti
- Python installato sulla tua macchina
- Una chiave API Scavio (free tier include 250 crediti/mese -- senza necessità di carta di credito)
Passo 1: Installa le Dipendenze
Installa requests per effettuare richieste HTTP:
pip install requestsPasso 2: Effettua la Tua Prima Ricerca su Google
Invia una richiesta POST all'endpoint API Scavio di Google con la tua query. L'API restituisce JSON strutturato con organic results, knowledge graph, People Also Ask e altro ancora.
import requests
API_KEY = "your_scavio_api_key"
response = requests.post(
"https://api.scavio.dev/api/v1/search",
headers={
"x-api-key": API_KEY,
"Content-Type": "application/json",
},
json={"query": query},
)
data = response.json()
for result in data.get("organic_results", [])[:5]:
print(f"{result['position']}. {result['title']}")
print(f" {result['link']}\n")Passo 3: Risposta di Esempio
L'API restituisce JSON strutturato. Ecco una risposta di esempio per una ricerca su Google:
{
"search_metadata": {
"status": "success",
"total_results": 1240000000
},
"organic_results": [
{
"position": 1,
"title": "Best Noise-Cancelling Headphones of 2026",
"link": "https://example.com/best-headphones",
"snippet": "We tested 30+ headphones to find the best...",
"displayed_link": "example.com"
}
],
"knowledge_graph": {
"title": "Noise-cancelling headphones",
"description": "Active noise-cancelling headphones use..."
},
"people_also_ask": [
{ "question": "What are the best noise cancelling headphones right now?" },
{ "question": "Is noise cancelling bad for your ears?" }
]
}Ogni campo è strutturato e tipizzato -- nessun parsing HTML, nessun selettore CSS, nessuna estrazione regex. Il tuo codice Python può accedere direttamente a qualsiasi campo.
Passo 4: Esempio Completo Funzionante
Ecco uno script Python completo ed eseguibile che cerca su Google e stampa i risultati:
"""
Scrape Google search results using Scavio API.
Returns structured JSON with organic results, knowledge graph, People Also Ask, and more.
"""
import requests
import json
API_KEY = "your_scavio_api_key"
def search_google(query: str) -> dict:
response = requests.post(
"https://api.scavio.dev/api/v1/search",
headers={
"x-api-key": API_KEY,
"Content-Type": "application/json",
},
json={"query": query},
)
response.raise_for_status()
return response.json()
if __name__ == "__main__":
results = search_google("best noise cancelling headphones 2026")
print(json.dumps(results, indent=2))Perché Usare Scavio Invece di Estrarre Dati Direttamente da Google?
- Nessuna gestione proxy. L'estrazione diretta richiede proxy rotanti per evitare ban IP. Scavio gestisce tutto questo lato server.
- Nessuna risoluzione di CAPTCHA. Google blocca aggressivamente le richieste automatizzate. Scavio restituisce dati puliti ogni volta.
- Output JSON strutturato. Nessun parsing HTML o manutenzione di selettori CSS. Ottieni dati tipizzati e coerenti da ogni richiesta.
- Multi-piattaforma in una sola API. Cerca su Google, Amazon, YouTube e Walmart con la stessa chiave API e lo stesso schema di autenticazione.
- Piano gratuito incluso. 250 crediti/mese senza necessità di carta di credito. Ogni ricerca costa 1 credito.