Définition
La récupération agent à deux niveaux est une architecture où un agent IA utilise une API de recherche structurée à faible coût pour la découverte initiale et n'appelle un scraper de page complète que pour les URL qui passent un filtre de pertinence.
En profondeur
Le calcul des coûts est frappant. Un service de scraping comme Firecrawl coûte 0,0016 $ par page sur son plan annuel à 83 $/100k. Une API SERP structurée comme Scavio coûte 0,005 $ par requête mais retourne 10 résultats avec titres, URL, extraits et métadonnées — aucun scraping nécessaire pour la plupart des recherches. Si un agent peut répondre à 80 % des requêtes à partir des seules données d'extrait SERP, le coût effectif par requête répondue passe de 0,016 $ (10 pages scrapées) à 0,005 $ (1 appel SERP). L'architecture comporte deux points de décision. Premièrement, l'agent appelle l'API de recherche et inspecte les données de résultat structurées. Si l'extrait d'un résultat contient les données nécessaires (prix, date, définition), l'agent les extrait et s'arrête. Deuxièmement, ce n'est que si les données structurées sont insuffisantes que l'agent transmet les 1 à 2 URL principales au scraper. Cette approche à deux portes réduit généralement les appels au scraper de 75 à 90 % dans les tâches de récupération d'informations. Pour les tâches de tarification e-commerce, les données structurées SERP (champs de prix des résultats Google Shopping) satisfont la requête dans 60 à 70 % des cas. Pour le contenu d'article complet ou les données dynamiques, le niveau de scraper est toujours nécessaire. Profilier les types de requêtes de votre agent avant de choisir entre les niveaux évite la sur-ingénierie.
Exemple d'utilisation
Un agent étudiant 100 prix de produits concurrents appelle l'API SERP pour les 100 requêtes (0,50 $), puis ne scrape que les 22 pour lesquelles le prix n'était pas dans l'extrait (0,035 $), coût total 0,535 $ contre 1,60 $ pour une approche de scraping en premier.
Plateformes
Récupération agent à deux niveaux est pertinent sur les plateformes suivantes, toutes accessibles via l'API unifiée de Scavio :
- amazon
Termes associés
Budget de recherche agentique
Un budget de recherche agentique est le nombre maximum de crédits ou le montant en dollars qu'un agent d'IA peut dépense...
Données SERP structurées
Les données SERP structurées sont des résultats de moteur de recherche livrés sous forme de champs JSON typés — titre, U...
Contournement Anti-Bot Cloudflare
Le contournement anti-bot de Cloudflare fait référence aux techniques utilisées par les web scrapers pour contourner les...