OpenAI ha annunciato o3, una versione migliorata del suo modello di intelligenza artificiale più capace finora, che impiega ancora più tempo a riflettere sulle domande, difficilmente un giorno da quando Google ha annunciato il suo primo modello di questo tipo.
Il nuovo modello di OpenAI, chiamato o3, sostituisce o1, presentato a settembre. Come l’o1, il nuovo modello passa il tempo a riflettere su un problema per fornire risposte migliori alle domande che richiedono un ragionamento logico graduale. OpenAI ha abile di esimersi da il nome “o2” perché è già il nome di un operatore di telefonia mobile nel Regno Unito. “Consideriamo questo come l’inizio della prossima fase dell’AI – ha dichiarato Sam Altman, ad di OpenAI, durante un livestream venerdì 20 dicembre – in cui è possibile utilizzare questi modelli per svolgere compiti sempre più complessi che richiedono un notevole ragionamento“.
I dati
OpenAI ha dichiarato che il modello o3 ha ottenuto punteggi molto più alti in diverse misure rispetto al suo predecessore, comprese quelle che misurano le abilità complesse legate alla codifica e le competenze matematiche e scientifiche avanzate. È tre volte migliore di o1 nel rispondere alle domande poste da ARC-AGI, un benchmark progettato per testare la capacità dei modelli di AI di ragionare su problemi matematici e logici estremamente difficili che incontrano per la prima volta.
Google sta portando avanti una linea di studio simile. Noam Shazeer, un ricercatore di Google, ha rivelato in un post su X che l’azienda ha sviluppato un proprio modello di ragionamento, chiamato Gemini 2.0 Flash Thinking. L’amministratore delegato di Google, Sundar Pichai, lo ha definito “il nostro modello che riflette di più” in un post. Il nuovo modello di Google ha ottenuto un punteggio elevato in SWE-Bench, un test che misura le capacità agenziali di un modello.
Tuttavia, il nuovo modello o3 di OpenAI è migliore del 20 % rispetto a o1. “O3 ha fatto il botto“, dice Ofir Press, un ricercatore post-dottorato dell’Università di Princeton che ha contribuito allo sviluppo di SWE-Bench. “Un aumento davvero sorprendente, non so come ci siano riusciti“.
Il confronto
I due modelli a confronto mostrano che la competizione tra OpenAI e Google è più accesa che mai. È fondamentale che OpenAI dimostri di poter continuare a fare progressi nel tentativo di attrarre maggiori investimenti e costruire un’attività redditizia. Google, nel frattempo, vuole dimostrare di essere all’avanguardia nella studio sull’AI. I nuovi modelli dimostrano inoltre come le aziende di intelligenza artificiale stiano cercando sempre più di non limitarsi a scalare i modelli per ricavarne una maggiore intelligenza.
Leggi tutto su www.wired.it
di Will Knight www.wired.it 2024-12-23 11:29:00 ,