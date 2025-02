Pubblicità

Meta (la società che controlla, tra gli altri, Facebook e WhatsApp) è stata chiamata in tribunale, accusata di violazione del copyright e concorrenza sleale per come avrebbe addestrato LLaMA (modello linguistico multimodali che dovrebbe garantire l’accesso ad un’AI multimodale e open source).

Dagli atti giudiziari si evince che dipendenti dell’azienda hanno scaricato 81,7TB di materiale pirata da “biblioteche ombra” quali Anna’s Archive, Z-Library e LibGen, dati sfruttati per addestrare i suoi modelli AI.

Dagli atti emerge che i ricercatori stessi incaricati di alimentare il modello AI erano preoccupati dall’uso di materiale di dubbia provenienza, protetto da copyright, consapevoli delle violazioni, e di compiere atti poco etici.

In un incontro del 2023, Mark Zuckerberg è stato informato del problema; quest’ultimo avrebbe suggerito di andare avanti, e alcuni dipendenti avrebbero sfruttato VPN per cercare di mascherare gli indirizzi IP dai quali partivano le richieste di download.

Non è la prima volta che aziende che lavorano in ambito AI sono accusate di ricorrere illegalmente a materiale protetto da copyright: OpenAI è stata accusata da alcuni scrittori di avere usato loro libri senza autorizzazione per addestrare modelli LLM; anche il New York Times ha denunciato OpenAI (e Microsoft) per aver sfruttato in modo illecito suoi articoli per l’addestramento dell’intelligenza artificiale.

Altra società accusata di avere usato libri pirata è Nvidia; quest’ultima nel marzo 2024 è stata accusata da alcuni scrittori di avere violato leggi sul diritto d’autore per avere sfruttato libri pirata inclusi in un set di dati illegale chiamato Books3 per addestrare il modello NeMo. Un ex dipendente di Nvidia ad agosto dello scorso anno ha riferito che l’azienda recuperava (da YouTube, Netflix e altre fonti) l’equivalente di 80 anni di video al giorno per l’addestramento di una AI (“Cosmos”) dedicata alla creazione di video.

