Google contém dados valiosos -- organic results, knowledge graph, People Also Ask, AI overview, e mais. Raspar esses dados diretamente significa lidar com detecção anti-bot, CAPTCHAs, rotação de IP e seletores que quebram constantemente. A API Scavio cuida de tudo isso e retorna JSON limpo e estruturado a partir de uma única requisição POST.
Este tutorial mostra como raspar Google usando Python e a API Scavio. Ao final, você terá um script Python funcional que obtém dados em tempo real do Google e analisa os resultados.
Pré-requisitos
- Python instalado em sua máquina
- Uma chave de API Scavio (free tier inclui 250 créditos/mês -- sem necessidade de cartão de crédito)
Passo 1: Instalar Dependências
Instale requests para fazer requisições HTTP:
pip install requestsPasso 2: Faça Sua Primeira Pesquisa no Google
Envie uma requisição POST para o endpoint da API Scavio Google com sua consulta. A API retorna JSON estruturado com organic results, knowledge graph, People Also Ask e mais.
import requests
API_KEY = "your_scavio_api_key"
response = requests.post(
"https://api.scavio.dev/api/v1/search",
headers={
"x-api-key": API_KEY,
"Content-Type": "application/json",
},
json={"query": query},
)
data = response.json()
for result in data.get("organic_results", [])[:5]:
print(f"{result['position']}. {result['title']}")
print(f" {result['link']}\n")Passo 3: Exemplo de Resposta
A API retorna JSON estruturado. Aqui está um exemplo de resposta para uma pesquisa no Google:
{
"search_metadata": {
"status": "success",
"total_results": 1240000000
},
"organic_results": [
{
"position": 1,
"title": "Best Noise-Cancelling Headphones of 2026",
"link": "https://example.com/best-headphones",
"snippet": "We tested 30+ headphones to find the best...",
"displayed_link": "example.com"
}
],
"knowledge_graph": {
"title": "Noise-cancelling headphones",
"description": "Active noise-cancelling headphones use..."
},
"people_also_ask": [
{ "question": "What are the best noise cancelling headphones right now?" },
{ "question": "Is noise cancelling bad for your ears?" }
]
}Cada campo é estruturado e tipado -- sem parsing de HTML, sem seletores CSS, sem extração com regex. Seu código Python pode acessar qualquer campo diretamente.
Passo 4: Exemplo Completo Funcional
Aqui está um script Python completo e executável que pesquisa no Google e imprime os resultados:
"""
Scrape Google search results using Scavio API.
Returns structured JSON with organic results, knowledge graph, People Also Ask, and more.
"""
import requests
import json
API_KEY = "your_scavio_api_key"
def search_google(query: str) -> dict:
response = requests.post(
"https://api.scavio.dev/api/v1/search",
headers={
"x-api-key": API_KEY,
"Content-Type": "application/json",
},
json={"query": query},
)
response.raise_for_status()
return response.json()
if __name__ == "__main__":
results = search_google("best noise cancelling headphones 2026")
print(json.dumps(results, indent=2))Por que usar Scavio em vez de raspar Google diretamente?
- Sem gerenciamento de proxy. A raspagem direta exige rotação de proxies para evitar bloqueios de IP. A Scavio cuida de tudo isso no servidor.
- Sem resolução de CAPTCHA. Google bloqueia agressivamente requisições automatizadas. A Scavio retorna dados limpos sempre.
- Saída JSON estruturada. Sem parsing de HTML ou manutenção de seletores CSS. Obtenha dados tipados e consistentes de cada requisição.
- Multiplataforma em uma API. Pesquise no Google, Amazon, YouTube e Walmart com a mesma chave de API e o mesmo padrão de autenticação.
- Camada gratuita incluída. 250 créditos/mês sem necessidade de cartão de crédito. Cada pesquisa custa 1 crédito.