Meta ammette di avere scaricato libri da torrent per addestrare una sua AI ma si difende affermando di avere modificato le impostazioni relative ai “seed” (in italiano “semi”) del client torrent utilizzato.
Nell’ambito del peer to peer i seed sono nodi della rete costituiti da quanti hanno già scaricato il file associato al .torrent e lo stanno solo inviando ad altri, una fase di solo invio nota come “seeding”. Il primo seed di un torrent è il releaser, che trasmette “pezzi” a peer fino a quando almeno uno di questi completa il torrent e, diventando seed, possa prendere il suo posto.
In alcuni documenti presentati al tribunale che sta esaminando la questione dei libri piratati scaricati da Meta (81,7TB di materiale), quest’ultima afferma di avere preso precauzioni modificando le impostazioni di seeding, e che gli autori che contestano il download dei volumi piratati non possono provare che questi siano stati diffusi a terzi passando da computer di Meta.
Obiettivo di Meta è convincere il giudice che usare i torrent non è di per sé illegale ma bensì “un protocollo ampiamente usato per scaricare file di grandi dimensioni”. Secondo Meta, la decisione di scaricare dataset di libri da librerie con materiale pirata quali LibGen e Z-Library è stata fatta per poter accedere ai dati di “archivi online conosciuti pubblicamente e disponibili tramite torrent”.
Nella documentazione presentata in tribunale Meta evita accuratamente di usare riferimenti a libri pirata ma cerca di dimostrare che i testi in questione sono gli stessi ai quali chiunque potrebbe accedere in una biblioteca pubblica, e che non avrebbe violato il CDAFA (California Comprehensive Computer Data Access and Fraud Act).
Meta afferma che non si può provare il seeding ma in precedenza Michael Clark, responsabile della gestione del progetto, aveva testimoniato spiegando che le impostazioni del client torrent sfruttato per i download erano state modificate per limitare il seeding al minimo, lasciando quindi intendere che la distribuzione in realtà era attiva.
Quella contro la società di Zuckerberg (che aveva dato il suo permesso ad addestrare modelli AI con i libri pirata) è solo una delle tante cause legali sul copyright che vedremo nei prossimi anni, man mano che emergerà l’uso di materiale illegale per addestrare le AI.
Per tutti gli articoli dedicati all’intelligenza artificiale si parte da questa pagina di macitynet.












