Intelligenza artificiale, qual è quella che crea le immagini migliori?

Intelligenza artificiale, qual è quella che crea le immagini migliori?

Intelligenza artificiale, qual è quella che crea le immagini migliori?


Come cambia l’interpretazione dei comandi da un sistema di intelligenza artificiale per la generazione di immagini all’altro? Come se la cavano i più avanzati algoritmi (MidJourney, Bing basato su Dall-E e Stable Diffusion) nella comprensione delle metafore e nel dare vita a immagini surreali? E che conoscenza hanno di lingue diverse dall’inglese?

In una fase storica in cui questi strumenti stanno entrando a gamba tesa nel campo dell’illustrazione – creando anche imprevisti problemi di copyright e sollevando ancora una volta il tema del loro impatto sul mondo del lavoro – diventa ancora più importante comprendere quali siano i limiti e gli ostacoli ancora da superare.

Da questo punto di vista, uno degli aspetti più complessi per un’intelligenza artificiale – che, ricordiamo, non è dotata di nessuna vera comprensione del mondo, ma è in grado solo di scovare correlazioni statistiche all’interno del suo database – è probabilmente l’interpretazione delle metafore (così come delle ambiguità linguistiche, dell’ironia, delle sfumature e di tutto ciò che nasconde più strati di significato). Lo ha sperimentato Wired, attraverso una serie di test:

  1. Dormire sugli allori
  2. Il gatto e il pane
  3. Mondo alla rovescia
  4. Alert mani

Dormire sugli allori

Come interpreta allora l’intelligenza artificiale il comando di raffigurare “una persona seduta sugli allori”? Questo modo di dire vale anche in inglese, dove al posto di “seduta” si usa però resting, ovvero “riposa”. Se avessero compreso la metafora, i tre sistemi impiegati avrebbero dovuto realizzare l’immagine di qualche persona abbastanza soddisfatta, un po’ compiaciuta, che ha raggiunto magari una certa fama e adesso si accontenta di quanto ottenuto (personalmente non ho idea di come si possa raffigurare una cosa del genere, ma d’altra parte non sono un illustratore). Prevedibilmente, nessuna intelligenza artificiale è riuscita a uscire dal significato letterale della metafora, confermando quindi di non avere la capacità di interpretarla correttamente. Allo stesso tempo, i risultati ottenuti dai tre generatori che abbiamo adoperato sono incredibilmente diversi.

MidJourney ha per esempio dato vita a questa immagine poetica: una persona avvolta in una tunica e con una dantesca corona d’alloro mentre dorme in una sorta di bozzolo sempre d’alloro. 



Leggi tutto su www.wired.it
di Andrea Daniele Signorelli www.wired.it 2023-04-03 05:00:00 ,

Previous Farina di insetti e rischio allergie: cosa sapere | Wired Italia

Leave Your Comment