Nvidia ha presentato un modello di intelligenza artificiale in grado di competere con i sistemi più sofisticati OpenAI, Google e Meta. La nuova AI è stata ribattezzata Nvlm 1.0 e potrebbe estendere il dominio del produttore di chip nel mercato emergente nato intorno alla tecnologia.
La nuova AI di Nvidia
L’azienda definisce Nvlm 1.0 come “una famiglia di grandi modelli linguistici (Llm) multimodali di frontiera che ottengono risultati all’avanguardia in compiti linguistici e di visione“. Come sottolinea la no profit Frontier model riunione, per Llm di frontiera si intendono i modelli che superano le capacità dei sistemi precedentemente considerati più avanzati in un’ampia gamma di compiti.
L’azienda guidata da Jensen Huang precisa che Nvlm-D-72B, la variante più potente del nuovo prodotto, può gestire fino a 72 miliardi di parametri e competere con offerte come GPT-4o, Llama 3-V-70B e Gemini 1.5 Pro. Nvidia riporta che le prestazioni del modello sul fronte dell’elaborazione di immagini, testi e problemi matematici sono eccezionali.
Il team di sviluppo dietro la nuova AI spiega di aver sfruttato un’architettura migliorata per l’addestramento e il ragionamento. “Nvlm-D-72B dimostra capacità versatili in vari compiti multimodali utilizzando congiuntamente tecnologie di riconoscimento ottico dei caratteri (Ocr), ragionamento, localizzazione, buon senso, conoscenze del mondo e capacità di programmazione“, si legge sul sito della società. In termini pratici, questo significa che il modello di Nvidia è in grado per esempio di comprendere l’umorismo di un meme, eseguire ragionamenti basati su elementi grafici come le tabelle, generare descrizioni dettagliate di un’immagine ma anche produrre una guida passo-passo per la risoluzione di problemi matematici.
L’azienda afferma che i dati di pre-addestramento e di addestramento sono stati selezionati “meticolosamente”, aggiungendo che i risultati ottenuti dimostrano che “la qualità dei dataset e la varietà dei compiti sono più importanti delle dimensioni, anche durante la fase di pre-addestramento“.
Una tabella di Nvidia che mette a confronto le capacità del nuovo modello con i principali Llm in circolazioneNvidia
Svolta open source
Il nuovo sistema è stato rilasciato con uno standard open source: il modello, le ordini e i parametri di addestramento sono quindi disponibili gratuitamente per l’uso, la modifica e la distribuzione su Megatron-Core, la library dell’azienda.
Leggi tutto su www.wired.it
di Fernanda González www.wired.it 2024-10-03 12:50:21 ,