• About
  • Advertise
  • Privacy & Policy
  • Contact
martedì, Luglio 15, 2025
  • Login
Roccarainola on line
  • Roccarainola
    • Aziende
    • Basket
    • Politica Comunale
      • Comune di Roccarainola Albo Pretorio
      • ATTI COMUNALI
      • La Gori
  • Area Nolana
    • Casamarciano
    • Cicciano
    • Nola
    • Tufino
    • San Giuseppe Vesuviano
  • Cronaca
    • Camorra
    • Ambiente
      • Terra dei Fuochi
  • Arte e Spettacolo
    • Musica
    • Cinema
    • Teatro
  • Politica
    • Governo
    • Parlamento
    • Regionale
      • Sanità
    • Economia e Lavoro
      • Concorsi
      • Turismo
  • Sport
    • Motori
      • SBK
  • Video Blog
    • Curiosità
    • Esperimenti sociali
    • Iovinocinemakers
    • Video Divertenti
    • Video Roccarainola
    • Covid-19
  • Shop
    • Libri
No Result
View All Result
Roccarainola on line
No Result
View All Result
Home Attualità

Cercasi llm italiano che parli bene l’italiano

Giugno 21, 2025
in Attualità
0
Cercasi llm italiano che parli bene l’italiano


Prendiamo 10mila domande a crocette su 12 domini diversi dai test pubblici per valutare la comprensione e la dimestichezza della lingua e cultura italiana. Rivolgiamole ai modelli linguistici di grandi dimensioni (llm) “stranieri” più noti al mondo stranieri e a quelli italiani. Chi risponde migliore? I primi.

Questo non è un invito all’autocommiserazione, è l’esito di Italic, il benchmark realizzato dal network di osservazione Crisp “per incoraggiare lo sviluppo di sistemi di linguaggio naturale più sofisticati e culturalmente consapevoli”. Uno dei suoi autori, Andrea Seveso, lo definisce “una roadmap per la osservazione futura”, Wired Italia lo ha trasformato in un’occasione per tornare a dare un’occhiata ai modelli parlanti italiano “testati” e scoprire come stanno, e dove stanno andando.

Come interroga Italic

Visto che la classifica realizzata da Italic ha smosso le zolle anche più silenziose dell’ecosistema ai italiano, migliore spiegare come questa suite di valutazione è nata e opera. Sul sito di Italic si trovano tutti i dettagli, dal processo di raccolta dati, fino alle strategie di selezione. Le domande poste ai modelli analizzati sono state selezionate da un dataset di 2.110.643 quesiti tratti dai test per l’ammissione ai Carabinieri, Polizia Penitenziaria, Esercito Italiano, Polizia di Stato, Corpo Forestale, Vigili del Fuoco, Aeronautica, Marina, Guardia di Finanza, ministeri italiani, insegnanti, dirigenti scolastici, infermieri e dirigenti della pubblica cura. Chi volesse mettersi alla prova in prima persona, può trovarle sul sito web di ciascun ente istituzionale.

Per valutare cultura e senso comune, Italic interroga in arte, educazione civica, geografia, storia, letteratura e anche viaggi, per valutare le capacità linguistiche, invece, su lessico, morfologia, ortografia, sintassi e capacità di sintesi. In tutti i sottodomini, Claude 3.5 Sonnet domina e gli ultimi posti in classifica sono occupati dai modelli che parlano italiano, in ordine prima quelli ottenuti con fine tuning su quelli inglesi e poi quelli “nativi” italiani.

Commenti tra i banchi

Anche se potenziali concorrenti, i modelli nazionali valutati commentano all’unisono gli esiti di Italic, come fossero voti di fine anno esposti sui cartelloni. Ciascuno con parole proprie, ma tutti fanno notare che “quando si comparano modelli da meno di una decina di miliardi di parametri, con quelli da 30 miliardi, è ovvio che emergono differenze notevoli” spiega Michele Montebovi di Llama 3.1. Uljan Sharka di iGenius, vedendo penultimo in classifica il suo Modello Italia parla di “distorsione della realtà”, perché “i modelli considerati non saranno mai comparabili: hanno troppe caratteristiche divergenti”.

Roberto Navigli, di Minerva, fa poi notare che “non tutti i modelli sono addestrati per rispondere a domande a risposta multipla, ma questo non significa che non abbiano una dimestichezza anche più approfondita di altri modelli”. Secondo Navigli, infatti, lasciando i modelli liberi di rispondere con parole proprie, i risultati potrebbero capovolgersi a favore di quelli addestrati in italiano. Dipende anche da come stanno evolvendo, ed è quindi il momento di scoprirlo, uno per uno, in rigoroso ordine di classifica.

LLaMAntino 3

L’assonanza del nome con Llama di Meta, non è un caso. Questo modello nasce infatti da un lavoro di fine tuning che il gruppo di osservazione Swap dell’Università di Bari ha effettuato su quel llm che, come molti altri, non supportava l’italiano. È da oltre due anni che opera così, sempre partendo da modelli open source e regalando loro nuove capacità. Prima con Bloom, poi con Llama 2, il team si è fatto le ossa, anche grazie all’utilizzo del supercomputer Leonardo a cui ha avuto accesso vincendo un progetto con Cineca.



Leggi tutto su www.wired.it
di Marta Abbà www.wired.it 2025-06-21 04:50:00 ,

Condividi:

  • Fai clic per condividere su X (Si apre in una nuova finestra) X
  • Fai clic per condividere su Facebook (Si apre in una nuova finestra) Facebook
  • Fai clic qui per condividere su LinkedIn (Si apre in una nuova finestra) LinkedIn
  • Fai clic qui per condividere su Reddit (Si apre in una nuova finestra) Reddit
  • Fai clic qui per condividere su Pinterest (Si apre in una nuova finestra) Pinterest
  • Fai clic qui per condividere su Pocket (Si apre in una nuova finestra) Pocket
  • Fai clic per condividere su Telegram (Si apre in una nuova finestra) Telegram
  • Fai clic per condividere su WhatsApp (Si apre in una nuova finestra) WhatsApp
  • Fai clic per condividere su Mastodon (Si apre in una nuova finestra) Mastodon
  • Fai clic per condividere su Nextdoor (Si apre in una nuova finestra) Nextdoor

Mi piace:

Mi piace Caricamento...
Tags: intelligenza artificialeItaliallm
Previous Post

Marco Buttu e l’esperienza nella Stazione accordo: “In Antartide è come stare su un altro pianeta: bianco, ostile e solitario”

Next Post

Le stablecoin salveranno il dollaro americano?

Related Posts

I porti del Nord Europa sono i crisi a causa di dazi e cambiamenti climatici. Ma l’Italia può approfittarne?

I porti del Nord Europa sono i crisi a causa di dazi e cambiamenti climatici. Ma l’Italia può approfittarne?

Luglio 15, 2025
0
0

"La diminuzione negli scambi tra Stati Uniti e Cina è diminuita in media del 15 %", spiega a Wired Paolo...

Migranti morti nel Mediterraneo, il buco nero dei dati

Migranti morti nel Mediterraneo, il buco nero dei dati

Luglio 15, 2025
0
0

I numeri reali li custodisce il mare, quelli noti sono sempre sottostimati: perché non esiste una norma, nazionale o europea,...

Ilva, l’ambientalizzazione nel 5% per la difesa. Il governo non risponde sugli esuberi

Ilva, l’ambientalizzazione nel 5% per la difesa. Il governo non risponde sugli esuberi

Luglio 14, 2025
0
0

L’acciaio green dell’Ilva finirà nel 5% del Pil in spese in armi e sicurezza che l’Italia si è impegnata a...

via libera dalla Corte Suprema

via libera dalla Corte Suprema

Luglio 14, 2025
0
0

Roma, 14 lug.(Adnkronos) - L’impatto economico di Airbnb sull'economia italiana è stato di 19,7 miliardi di euro nel 2024, il...

Please login to join discussion
Dazi Trump, Ue pronta a reagire: la strategia, ultime news

Dazi Trump, Ue pronta a reagire: la strategia, ultime news

Luglio 15, 2025
I porti del Nord Europa sono i crisi a causa di dazi e cambiamenti climatici. Ma l’Italia può approfittarne?

I porti del Nord Europa sono i crisi a causa di dazi e cambiamenti climatici. Ma l’Italia può approfittarne?

Luglio 15, 2025
Migranti morti nel Mediterraneo, il buco nero dei dati

Migranti morti nel Mediterraneo, il buco nero dei dati

Luglio 15, 2025
Via libera definitivo della Camera al decreto campagna Flegrei: è legge. Ecco le novità

Via libera definitivo della Camera al decreto campagna Flegrei: è legge. Ecco le novità

Luglio 15, 2025
Cultura previdenziale nelle scuole, firmato il protocollo d’affinità

Cultura previdenziale nelle scuole, firmato il protocollo d’affinità

Luglio 15, 2025
Tulum Energy, dall’Italia al Messico (e ritorno): la startup pioniera dell’idrogeno turchese

Tulum Energy, dall’Italia al Messico (e ritorno): la startup pioniera dell’idrogeno turchese

Luglio 14, 2025
Trump detta la linea sull’Ucraina

Trump detta la linea sull’Ucraina

Luglio 14, 2025
Si chiude il sipario sulla decima edizione della Festa Medievale “La Damigella …

Si chiude il sipario sulla decima edizione della Festa Medievale “La Damigella …

Luglio 14, 2025
“54mila docenti assunti per il prossimo anno”, la promessa di Valditara

“54mila docenti assunti per il prossimo anno”, la promessa di Valditara

Luglio 14, 2025
Satnam Singh, la madre in lacrime nell’incontro in Regione Lazio: “Ora giustizia”

Satnam Singh, la madre in lacrime nell’incontro in Regione Lazio: “Ora giustizia”

Luglio 14, 2025
Fiorentina, su il sipario: Stefano Pioli non si nasconde

Fiorentina, su il sipario: Stefano Pioli non si nasconde

Luglio 14, 2025
via libera dalla Corte Suprema

via libera dalla Corte Suprema

Luglio 14, 2025
Ilva, l’ambientalizzazione nel 5% per la difesa. Il governo non risponde sugli esuberi

Ilva, l’ambientalizzazione nel 5% per la difesa. Il governo non risponde sugli esuberi

Luglio 14, 2025
Concorso per 1 istruttore polizia locale (lombardia) COMUNE DI VERGIATE

Concorso per 1 istruttore polizia locale (lombardia) COMUNE DI VERGIATE

Luglio 14, 2025
Concorso per 1 funzionario tecnico (lombardia) COMUNE DI CERVIGNANO D’ADDA

Concorso per 1 funzionario tecnico (lombardia) COMUNE DI CERVIGNANO D’ADDA

Luglio 14, 2025

Archivi

Roccarainola on line

Copyright © 2017 Roccarainola on line

Navigate Site

  • About
  • Advertise
  • Privacy & Policy
  • Contact

Follow Us

Welcome Back!

Login to your account below

Forgotten Password?

Retrieve your password

Please enter your username or email address to reset your password.

Log In
No Result
View All Result
  • Home
  • News
    • Politics
    • Business
    • World
    • Science
  • Entertainment
    • Gaming
    • Music
    • Movie
    • Sports
  • Tech
    • Apps
    • Gear
    • Mobile
    • Startup
  • Lifestyle
    • Food
    • Fashion
    • Health
    • Travel

Copyright © 2017 Roccarainola on line

%d