Définition
Un index de recherche local pour RAG est un moteur de recherche sur site ou auto-hébergé (comme Elasticsearch, Meilisearch ou SQLite FTS) utilisé comme backend de récupération dans un pipeline de génération augmentée par récupération, offrant des recherches rapides, privées et sans frais sur un corpus organisé.
En profondeur
Les systèmes RAG ont besoin d'une étape de récupération pour trouver des documents pertinents avant que le LLM génère une réponse. Un index de recherche local stocke et recherche un corpus organisé de documents sur l'infrastructure propre du développeur. Cela offre une récupération sans latence, sans coût et entièrement privée, mais uniquement sur les documents qui ont été indexés. Pour les questions qui dépassent le corpus local, une approche hybride combine la recherche locale avec une API de recherche en direct. L'index local gère les requêtes de domaine connu (documents d'entreprise, catalogue de produits, données historiques), tandis que l'API de recherche gère les requêtes de domaine ouvert (informations sur les concurrents, actualités, sentiment public). L'API de Scavio sert de couche de recherche en direct dans cette architecture, complétant plutôt que remplaçant l'index local.
Exemple d'utilisation
Un bot de support client recherche d'abord dans un index Meilisearch local d'articles d'aide. Si le score de confiance est inférieur à 0,7, il tombe en recours sur le point de terminaison Google de Scavio pour chercher la réponse sur le web public, garantissant une couverture même lorsque la documentation interne est incomplète.
Plateformes
Index de recherche local pour RAG est pertinent sur les plateformes suivantes, toutes accessibles via l'API unifiée de Scavio :
- YouTube
Termes associés
Architecture de la couche de chat RAG
L'architecture de la couche de chat RAG est un modèle de conception pour les systèmes d'IA conversationnelle qui sépare ...
SERP API
Une SERP API est une interface programmatique qui récupère les pages de résultats des moteurs de recherche et les renvoi...
Chaînage de backends de recherche
Le chaînage de backends de recherche est un modèle dans lequel une application achemine une requête de recherche via plu...