Definizione
La Generazione Aumentata da Recupero (RAG) è un'architettura AI che migliora gli output dei modelli linguistici di grandi dimensioni recuperando prima documenti pertinenti da fonti esterne, poi utilizzando quel contesto per generare risposte più accurate e fondate.
Approfondimento
La RAG affronta la limitazione fondamentale dei LLM: i loro dati di addestramento hanno una data di cutoff e possono allucinare fatti. In una pipeline RAG, un passaggio di recupero preleva documenti pertinenti, risultati web o record di database prima che il LLM generi una risposta. Questo fonda l'output su dati reali. Per applicazioni che necessitano di informazioni aggiornate, abbinare la RAG a un'API di ricerca in tempo reale come Scavio garantisce che il passaggio di recupero restituisca sempre risultati freschi. Le architetture RAG comuni utilizzano database vettoriali per documenti memorizzati e API di ricerca per dati web in tempo reale, combinando entrambi per finestre di contesto complete.
Utilizzo di Esempio
Un bot di assistenza clienti utilizza la RAG per rispondere a domande sui prodotti. Recupera le specifiche più recenti dai risultati di ricerca di Google di Scavio e le combina con la documentazione interna prima di generare una risposta, garantendo precisione senza riaddestramento.
Piattaforme
Generazione Aumentata da Recupero (RAG) è rilevante sulle seguenti piattaforme, tutte accessibili tramite l'API unificata di Scavio:
- YouTube
Termini correlati
Ricerca Semantica vs Ricerca per Parole Chiave
La ricerca per parole chiave trova documenti che contengono i termini esatti di una query, mentre la ricerca semantica u...
Tool Calling degli Agenti AI
Il tool calling è il meccanismo con cui un agente AI istruisce un modello linguistico di grandi dimensioni a invocare un...
Risultati di Ricerca Strutturati
I risultati di ricerca strutturati sono risultati dei motori di ricerca che sono stati analizzati e organizzati in un fo...