La domanda non è solo a chi interessa e chi veramente vuole una rete di questo tipo – la cui risposta è semplice: le aziende e i politici che ne possono trarre beneficio – ma piuttosto come cambierà internet con l’aumentare dell’utilizzo dell’AI generativa e quali saranno le conseguenze per i suoi utilizzatori.
La corsa ai dati di origine umana
I modelli linguistici di grandi dimensioni (LLM), come ChatGPT, Gemini o Claude, solo per citarne alcuni, sono stati inizialmente “addestrati” su enormi dataset come BookCorpus, una collezione di circa settemila libri, e WebText, otto milioni di pagine web selezionate per la qualità dei loro contenuti. Con il passare del tempo sono stati aggiunti altri dataset, come CommonCrawl, WebText2, Books1, Books2 e Wikipedia in inglese. A livello di scala, GPT2 era dieci volte più grande di GPT 2 e GPT3 era 10 volte più grande del precedente. Si parla di 500 Gb, quasi 500 miliardi di parole e 175 miliardi di parametri. E se i modelli sono connessi alla rete, il materiale che troveranno sarà, almeno in parte, il prodotto di quello che l’AI ha generato. Secondo diverse ricerche, questo processo di autofagia potrebbe portare a un progressivo abbassamento del livello dei risultati prodotti dai bot chiamato model collapse.
Alla base dei LLM c’è stata finora la conoscente umana, non quella creata dalle stesse intelligenze artificiali che la utilizzano. In questo contesto, i dati umani rappresentano uno standard di qualità necessario al continuo miglioramento delle performance dell’AI. Quando avremo digitalizzato l’intero scibile umano però, non resterà che ricorrere a contenuti sintetici. Considerando la mole di parametri e di dati su cui gli attuali LLM sono “addestrati” quel momento non è forse così lontano. E a quel punto, quando tutto quello che poteva essere digitalizzato sotto forma di testo e immagini sarà stato dato in pasto ai modelli linguistici, non resterà che “osservare” il mondo reale. Questa ipotesi di futuro porta a pensare che le nuove AI multi-modali utilizzeranno i dati che provengono direttamente dal mondo offline per diventare sempre più “intelligenti”. Almeno a dire dei loro produttori, la strada verso l’adozione di agenti autonomi sembra spianata. Contemporaneamente però si stanno delineando scenari di sorveglianza che vanno gestiti con cautela per scongiurare di dare in mano alle AI dati sensibili che possono diventare pericolosi.
Un futuro distopico, ma possibile
Non solo le AI già riassumono i risultati dei motori di studio, creano libri, musica e video sulla base dei nostri input, ma sembrano destinate a diventare sempre più autonome. Volendo ipotizzare uno scenario futuro distopico – ma non per questo poco realistico – potremmo essere all’alba di un’enshittification sintetica in cui contenuti di bassa qualità, creati dai bot, saranno fatti circolare dagli algoritmi che questi scelgono per ottimizzare i risultati, tramite l’utilizzo di altri bot che aumentano le interazioni con gli utenti. Gli user in sostanza diventerebbero solo una parte degli utilizzatori finali – dei consumatori come appunto suggerisce il termine inglese – perdendo gradualmente il loro ruolo di creatori. Un processo che, almeno parzialmente, è già in atto.
La nascita di internet ha portato ad un’esplosione di creatività, poi seguita dall’automazione di diversi compiti, anche creativi, come la programmazione e la produzione di contenuti. Oggi i bot e gli algoritmi di targeting delle piattaforme social determinano cosa gli umani consumano nella loro esperienza online. Sembrano ritornare continuamente le questioni sociali che conosciamo da decenni: la privacy, la proprietà dei dati e il diritto d’autore, la sorveglianza, le discriminazioni, i meccanismi black-box. E accanto ai temi più spinosi sorgono enormi possibilità di ampliare la conoscente umana, di risolvere problemi scientifici e di giungere a scoperte inaspettate. Domani come allora saranno le scelte delle grandi aziende, dei governi e della società civile a definire l’aspetto dell’internet postumana. Auspicabilmente imparando qualcosa dagli errori commessi in passato.