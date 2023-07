All’intelligenza artificiale basta una foto per farvi ballare: DisCo – acronimo di Disentangled Control for Real-World Reference Human Dance Generation – infatti è capace di generare un video piuttosto realistico di una persona che balla basando tutto lo sviluppo su una sola fotografia.

Si tratta di una ricerca che è ancora alla fase preprint, quindi manca la revisione formale tra pari e la pubblicazione in una rivista accademica o scientifica sottoposta a revisione paritaria, ma è già arrivata al punto che basterebbe scattarvi una foto per poter poi pubblicare in rete un video di una scena che non è mai esistita, aprendo le porte ad usi (e abusi) dell’AI che vanno oltre ogni immaginazione.

Questo nuovo modello di intelligenza artificiale generativa, chiamata così perché appunto non si limita ad elaborare dei dati ma è in grado di creare contenuti completamente nuovi, è stato sviluppato dalla Nanyang Technological University di Singapore in collaborazione con il team di Azure, la piattaforma di cloud computing di Microsoft, e per comprenderne a pieno le sue potenzialità vi basta dare un’occhiata al filmato che trovate qui sotto.

Come funziona

Dal minuto 1:14 è ben evidente come, da una sola immagine, gli algoritmi sono in grado di far compiere al soggetto movimenti che appaiono decisamente fluidi e naturali, sebbene questi non siano mai avvenuti perché si tratta appunto di una semplice fotografia.

L’AI è arrivata a questo stadio evolutivo grazie al lavoro dei ricercatori che l’hanno addestrata usando circa 350 video da 10-15 secondi pubblicati su TikTok. In breve hanno estrapolato i singoli fotogrammi usando poi lo strumento OpenPose per indicare le giunture delle varie parti del corpo su ciascuna scena: in questo modo la piattaforma è stata praticamente istruita sul modo in cui il corpo umano si muove in diverse sequenze di ballo.

L’altra grande tecnologia usata da DisCo riguarda la capacità di scontornare il soggetto e ricostruire lo sfondo senza averlo mai visto: sebbene ancora non sia perfetto, il risultato finale presenta già un livello di credibilità piuttosto elevato.

La presentazione del progetto è disponibile su questo archivio della Cornell University.

Possibili impieghi e rischi

Una volta affinate, tecnologie come queste potranno trovare mercato sia nel settore pubblicitario che quello cinematografico, riducendo i costi di sviluppo di uno spot o di una scena di un film. Ma il rischio è anche quello di facilitare la creazione di video deepfake, che già oggi la società fatica a riconoscere proprio per l’alto livello di realismo che l’AI ha ormai raggiunto (come individuarli e proteggersi dalle truffe).