Définition
La génération augmentée par récupération (RAG) est une architecture d'IA qui améliore les sorties des grands modèles de langage en récupérant d'abord des documents pertinents provenant de sources externes, puis en utilisant ce contexte pour générer des réponses plus précises et fondées.
En profondeur
Le RAG répond à la limitation fondamentale des LLM : leurs données d'entraînement ont une date de coupure et ils peuvent halluciner des faits. Dans un pipeline RAG, une étape de récupération extrait des documents pertinents, des résultats web ou des enregistrements de base de données avant que le LLM ne génère une réponse. Cela ancre la sortie dans des données réelles. Pour les applications nécessitant des informations actualisées, associer le RAG à une API de recherche en temps réel comme Scavio garantit que l'étape de récupération renvoie toujours des résultats frais. Les architectures RAG courantes utilisent des bases de données vectorielles pour les documents stockés et des API de recherche pour les données Web en direct, combinant les deux pour des fenêtres de contexte complètes.
Exemple d'utilisation
Un bot de support client utilise le RAG pour répondre aux questions sur les produits. Il récupère les dernières spécifications à partir des résultats de recherche Google de Scavio et les combine avec la documentation interne avant de générer une réponse, garantissant ainsi l'exactitude sans nécessiter de réentraînement.
Plateformes
Génération augmentée par récupération (RAG) est pertinent sur les plateformes suivantes, toutes accessibles via l'API unifiée de Scavio :
- YouTube
Termes associés
Recherche sémantique vs recherche par mots-clés
La recherche par mots-clés trouve les documents contenant exactement les termes d'une requête, tandis que la recherche s...
Appel d'outil d'agent IA
L'appel d'outil est le mécanisme par lequel un agent IA demande à un grand modèle de langage d'invoquer une fonction ou ...
Résultats de recherche structurés
Les résultats de recherche structurés sont des résultats de moteur de recherche qui ont été analysés et organisés dans u...