Définition
La recherche par mots-clés trouve les documents contenant exactement les termes d'une requête, tandis que la recherche sémantique utilise des plongements vectoriels pour trouver des documents conceptuellement similaires, même s'ils utilisent des mots différents.
En profondeur
La recherche traditionnelle par mots-clés repose sur la fréquence des termes, les index inversés et des algorithmes comme BM25 pour classer les documents contenant les termes de la requête. La recherche sémantique utilise des réseaux neuronaux pour convertir le texte en vecteurs de haute dimension (plongements) et trouve des résultats basés sur la similarité cosinus dans cet espace vectoriel. Cela signifie qu'une recherche sémantique pour « hébergement abordable » peut correspondre à des documents sur « hôtels économiques » ou « endroits pas chers où séjourner ». Dans les applications RAG, la combinaison des deux approches donne les meilleurs résultats : la recherche sémantique pour le rappel et la recherche par mots-clés pour la précision. Les API de recherche comme Scavio renvoient des résultats correspondant aux mots-clés des grandes plateformes, qui peuvent être combinés avec les résultats de la base de données vectorielle dans une stratégie de récupération hybride.
Exemple d'utilisation
Un pipeline RAG utilise la recherche sémantique dans une base de données vectorielle de documents internes et la recherche par mots-clés via Scavio pour des résultats web en temps réel. Les deux ensembles de résultats sont fusionnés et reclassés avant d'être envoyés au LLM comme contexte, combinant connaissances institutionnelles et informations actuelles.
Plateformes
Recherche sémantique vs recherche par mots-clés est pertinent sur les plateformes suivantes, toutes accessibles via l'API unifiée de Scavio :
- YouTube
Termes associés
Génération augmentée par récupération (RAG)
La génération augmentée par récupération (RAG) est une architecture d'IA qui améliore les sorties des grands modèles de ...
Classification de l'intention de recherche
La classification de l'intention de recherche est le processus qui consiste à catégoriser une requête de recherche selon...
Résultats de recherche structurés
Les résultats de recherche structurés sont des résultats de moteur de recherche qui ont été analysés et organisés dans u...