L’intelligenza artificiale è una delle tecnologie più innovative e promettenti del nostro tempo, capace di trasformare il modo in cui viviamo, lavoriamo e comunichiamo. Tuttavia, l’AI non è una singola entità, ma un insieme di diverse applicazioni e metodi che si basano su vari modelli e algoritmi. Tra questi, i Large Language Models (LLM) sono tra i più popolari e potenti, in grado di generare testi naturali e realistici a partire da un input o una domanda. Esempi di LLM sono GPT-3, BERT e T5, che hanno dimostrato prestazioni impressionanti in diversi compiti di comprensione e produzione del linguaggio.
Tuttavia, i LLM hanno anche dei limiti, che ne ostacolano l’efficacia e l’affidabilità. Uno di questi limiti è la dipendenza esclusiva dai dati di addestramento, che possono essere incompleti, obsoleti o inaccurati. Inoltre, i LLM non sono in grado di integrare le informazioni provenienti da fonti esterne, che potrebbero essere più aggiornate, rilevanti e verificate. Questo significa che i LLM possono generare testi che sono coerenti e informativi, ma non necessariamente corretti o pertinenti.
Retrieval Augmented Generation
Per superare questi limiti una soluzione potrebbe derivare dalla Retrieval Augmented Generation (RAG). Un paper del 2020, “Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks”, firmato da Patrick Lewis e altri autori di Facebook AI Research, ha fatto conoscere la RAG agli sviluppatori di AI generativa. La RAG è un modello che unisce le capacità generative dei LLM con le capacità di reperire informazioni da una fonte di conoscenza esterna. Così facendo, la RAG riesce a creare testi più ricchi, corretti e rilevanti, basati su dati aggiornati e specifici per il settore o per l’ente. In questo modo, la RAG può integrare il testo generato con informazioni supplementari, precise e particolari, che aumentano la qualità e la pertinenza del testo.
La RAG funziona in due fasi: nella prima, il modello riceve un input o una domanda e cerca i documenti più rilevanti da una collezione di fonti esterne. Nella seconda, il modello usa i documenti recuperati e l’input per generare il testo finale, che incorpora le informazioni trovate. La RAG può essere applicata a diversi tipi di input, come parole chiave, frasi, domande o immagini, e può generare diversi tipi di output, come risposte, riassunti, articoli o descrizioni.
I vantaggi della RAG
I vantaggi della RAG sono molteplici. Innanzitutto, la RAG migliora la capacità dei modelli di linguaggio di rispondere a domande complesse e specifiche, integrando le ultime e più rilevanti informazioni. Inoltre, la RAG aiuta ad attenuare problemi come le allucinazioni e la perdita di dati, rendendo le interazioni con l’IA più affidabili. Inoltre, la RAG consente ai modelli di linguaggio di adattarsi a diversi compiti e domini, sfruttando la flessibilità e la varietà delle fonti di conoscenza.
Leggi tutto su www.wired.it
di Lucia Tedesco www.wired.it 2024-01-14 06:00:00 ,