Définition
Les données SERP structurées sont des résultats de moteur de recherche livrés sous forme de champs JSON typés — titre, URL, extrait, position, prix, note, date — plutôt que du HTML brut nécessitant un parsing.
En profondeur
Le scraping HTML brut des résultats de recherche Google nécessite de maintenir des sélecteurs CSS qui se cassent 3 à 5 fois par an lorsque Google met à jour son DOM. Les API SERP parsées fournissent les mêmes données sous forme de contrats JSON stables. La différence de coût technique : un scrapeur brut nécessite 20 à 40 heures de construction et 5 à 10 heures/an de maintenance ; une intégration d'API SERP nécessite 1 à 2 heures d'intégration et zéro maintenance. Les champs structurés varient selon le type de résultat. Les résultats web incluent : `title` (chaîne), `url` (chaîne), `snippet` (chaîne, 150-200 caractères), `position` (entier), `date` (chaîne ISO quand disponible). Les résultats shopping ajoutent `price` (chaîne avec devise), `rating` (flottant), `reviews` (entier), `seller` (chaîne). Les résultats du panneau de connaissances ajoutent `description`, `attributes` (paires clé-valeur), `website`. Ces champs sont directement consommables par les LLM sans logique de parsing. Pour une utilisation spécifique par un agent IA, les données structurées permettent l'injection de prompt sans prétraitement. Un champ extrait peut être directement inséré dans un prompt système : 'According to [source]: [snippet]'. Le HTML brut injecté dans un prompt consomme 10 à 50 fois plus de tokens pour la même densité d'information, augmentant à la fois le coût et la probabilité que le LLM perde le focus sur le contenu pertinent dans un grand bloc HTML.
Exemple d'utilisation
Un agent injectant des extraits SERP structurés a utilisé 850 tokens par réponse fondée. Le même agent injectant du HTML brut pour les mêmes requêtes a utilisé 11 200 tokens par réponse — 13 fois plus, avec un coût d'API LLM proportionnellement plus élevé.
Plateformes
Données SERP structurées est pertinent sur les plateformes suivantes, toutes accessibles via l'API unifiée de Scavio :
- amazon
- walmart
Termes associés
Précision d'ancrage SERP
La précision d'ancrage SERP est l'amélioration de l'exactitude factuelle obtenue lorsque la réponse d'un LLM est générée...
Récupération agent à deux niveaux
La récupération agent à deux niveaux est une architecture où un agent IA utilise une API de recherche structurée à faibl...
RAG augmenté par recherche
Le RAG augmenté par recherche est un modèle de génération augmentée par récupération où les résultats d'une API de reche...