È di pochi giorni addietro la notizia che Apple avrebbe comprato dati per addestrare sue IA da una fonte controversa, quest’ultima accusata di avere sottratto con metodi discutibili la trascrizione di video di YouTube (senza il consenso dei creator): filmati educativi del MIT, quelli di alcuni popolari programmi TV americani e anche video di noti youtuber come Marques Brownlee.

Apple avrebbe usato il dataset per addestrare OpenELM, un modello linguistico di grandi dimensioni open-source presentato ad aprile, progettato per essere eseguito “on device” (direttamente sul dispositivo).

Apple ha confermato al sito statunitense 9to5Mac che OpenELM non alimenta sue AI, funzionalità di machine learning e Apple Intelligence.

Il modello OpenEL (pubblicato come open source e disponibile sul sito di Apple dedicato al Machine Learning) è stato creato per finalità di ricerca e non per alimentare funzionalità di Apple Intelligence.

Poiché OpenELM non è stato usato per Apple Intelligence, il dataset di sottotitoli dei filmati degli youtuber non è stato sfruttato per l’IA di Apple. In precedenza Apple ha spiegato che i modelli di Apple Intelligence sono stati addestrati su “dati concessi in licenza”, inclusi dati selezionati per valorizzare specifiche peculiarità, così come dati pubblicamente disponibili raccolti da suoi web-crawler.

OpenELM (acronimo di Open-source Efficient Language Models) è l’ultimo di vari modelli AI open source presetati da Apple. I modelli OpenELM della Mela sono disponibili in quattro diverse varianti con dimensioni da 270 milioni, 450 milioni, 1,1 miliardi e 3 miliardi di parametri, ognuno dei quali è più piccolo di molti modelli ad alte prestazioni in circolazione (generalmente aggirano intorno ai 7 miliardi di parametri) e ciascuno dei quali è disponibile in versione pre-addestrata e istruita. Apple ha spiegato che i suoi modelli sono stati pre-addestrati su dataset pubblici di 1.800 miliardi di “token” provenienti da Reddit, Wikipedia, arXiv.org e altri.

Pur essendo più piccolo rispetto a modelli come OpenAI GPT-4, Claude 3 di Anthropic e Meta Llama, OpenELM è ottimizzato per consentire l’esecuzione su computer portatili e alcuni smartphone e tablet (es. iPhone e iPad recenti).

