Anche se le cause non sono mai esattamente amichevoli, la battaglia legale sul copyright avviata dal New York Times contro OpenAI e Microsoft si sta facendo particolarmente conflittuale. Questa settimana, il famoso quotidiano statunitense ha infatti accusato gli ingegneri di OpenAI di aver inavvertitamente cancellato i dati sui cui i legali della pubblicazione avevano lavorato per oltre 150 ore allo scopo di estrapolare potenziali prove.
OpenAI è riuscita a recuperare gran parte dei dati, ma il team del New York Times afferma che all’appello mancano ancora i nomi originali dei file e la struttura delle cartelle. Secondo una dichiarazione depositata mercoledì in tribunale da Jennifer B. Maisel, avvocato del giornale, questo significa che le informazioni “non possono essere utilizzate per determinare dove gli articoli copiati dai querelanti” potrebbero essere stati incorporati all’interno dei modelli di intelligenza artificiale di OpenAI. “Non siamo d’accordo con le caratterizzazioni fatte e presenteremo presto la nostra replica“, ha dichiarato a Wired US il portavoce di OpenAI Jason Deutrom. Il New York Times ha rifiutato di esplicare.
La causa del New York Times a OpenAI
L’anno scorso il New York Times aveva fatto causa a OpenAI e Microsoft per violazione del copyright, sostenendo che le due aziende avrebbero usato illegalmente i suoi articoli per addestrare strumenti AI come ChatGPT. Il caso rappresenta una delle tanti scontri legali in corso tra le aziende del settore e gli editori (tra cui anche una causa simile presentata dal Daily News e seguita da alcuni degli stessi avvocati).
Il caso è attualmente in fase di discovery, il che significa che entrambe le parti stanno consegnando la documentazione e le informazioni che potrebbero diventare prove. Nell’ambito del processo, il tribunale ha imposto a OpenAI di mostrare al Times i suoi dati di addestramento. L’obbligo rappresenta una novità assoluta, dal momento che la società non ha mai rivelato pubblicamente quali informazioni ha utilizzato per costruire i suoi modelli di intelligenza artificiale. Per ottemperare alla richiesta, la società ha creato quella che la corte definisce una “sandbox” composta da due “macchine virtuali” che gli avvocati del quotidiano hanno potuto esaminare. Nella sua dichiarazione, Maisel ha affermato che gli ingegneri di OpenAI hanno “cancellato” i dati raccolti dal team del New York Times su una di queste macchine.
Dati che spariscono e le altre controversie
Stando alla versione dell’avvocato, OpenAI ha riconosciuto che le informazioni erano state cancellate e ha cercato di risolvere il problema poco dopo essere stata avvertita, all’inizio del mese. A quanto pare però, i dati “ripristinati” risultavano traboccante disorganizzati, un aspetto che ha costretto i legali del giornale “a ricreare il loro lavoro da zero con un notevole impiego di ore di lavoro e tempo di elaborazione“, si legge in una lettera inviata da altri membri del team del Times e depositata al giudice lo stesso giorno della dichiarazione di Maisel.
Gli avvocati hanno anche sottolineato di non aver “ragione di credere” che la cancellazione sia stata “intenzionale”. Nelle email presentate come reperto insieme alla lettera di Maisel, il legale di OpenAI Tom Gorman ha definito l’episodio un “problema tecnico“.
Leggi tutto su www.wired.it
di Kate Knibbs www.wired.it 2024-11-22 10:57:00 ,