Le problème
L'extraction des données Google Shopping pour le suivi des prix nécessite une gestion des proxys, une résolution de captcha et une rotation des sessions. Les proxys résidentiels coûtent $10-15/Go, les proxys de datacenter sont bloqués en moins de 20 requêtes, et même les fournisseurs chers ont des IP déjà signalées par Google.
La solution Scavio
Utilisez une API de recherche structurée qui renvoie les listes Google Shopping sous forme de JSON typé. L'API gère en interne les mesures anti-bot de Google. Vous obtenez les noms des produits, les prix, les vendeurs et la disponibilité sans gérer aucune infrastructure de proxy.
Avant
Avant de changer, une équipe de suivi des prix utilisait des proxys résidentiels rotatifs à $12/Go. Le taux de captcha était de 15-20% des requêtes. Coût du proxy : $80/mois. Résolution de captcha : $15/mois. Temps d'ingénierie pour maintenir les parseurs : 4 heures/semaine. Taux de réussite : 75-80%.
Après
Après être passé à une API de recherche, la même équipe obtient des données Shopping à $0.005/requête avec un taux de réussite de 99%+. 2 000 produits/jour = $10/jour ($300/mois). Aucune gestion de proxy, aucune maintenance de parseur, aucun coût de captcha. Temps d'ingénierie : zéro continu.
À qui cela s'adresse
Équipes e-commerce, services de suivi des prix et dropshippers qui ont besoin de données Google Shopping sans gérer d'infrastructure de proxy.
Avantages clés
- Aucune infrastructure de proxy ni logique de rotation nécessaire
- Taux de réussite de 99%+ contre 75-80% avec les proxys
- Le JSON structuré élimine l'analyse HTML
- Données de la grille Google Shopping : prix, vendeur, disponibilité
- $0.005/requête contre $80+/mois de coûts proxy + captcha
Exemple Python
import requests, os
H = {'x-api-key': os.environ['SCAVIO_API_KEY']}
def shopping_data(product):
r = requests.post('https://api.scavio.dev/api/v1/search', headers=H,
json={'platform': 'google', 'query': f'{product} price'},
timeout=10).json()
results = r.get('organic_results', [])[:5]
return [{'title': r.get('title', ''), 'price': r.get('price', 'N/A'),
'source': r.get('source', '')} for r in results]
for item in shopping_data('Sony WH-1000XM5'):
print(f"{item['title'][:40]} - {item['price']} ({item['source']}")Exemple JavaScript
const H = {'x-api-key': process.env.SCAVIO_API_KEY, 'Content-Type': 'application/json'};
async function shoppingData(product) {
const r = await fetch('https://api.scavio.dev/api/v1/search', {
method: 'POST', headers: H,
body: JSON.stringify({platform: 'google', query: `${product} price`})
}).then(r => r.json());
return (r.organic_results || []).slice(0, 5).map(r => ({
title: r.title, price: r.price || 'N/A', source: r.source || ''
}));
}
shoppingData('Sony WH-1000XM5').then(d => d.forEach(i => console.log(`${i.title} - ${i.price}`)));Plateformes utilisées
Recherche web avec graphe de connaissances, PAA et aperçus IA