Disney ha ideato il riconoscimento facciale e metadati per l’animazione

18 Lug 2020

I mondi immaginari degli studi di animazione di Disney sono caratterizzati da centinaia e centinaia di personaggi di fantasia frutto di quasi un secondo di produzioni cinematografiche. Un team di ricercatori della Direct-to-Consumer & International Organization (DTCI) – comparto e succursale di Disney – è riuscito a creare una piattaforma di machine learning che può essere di aiuto nell’automatizzare l’archiviazione digitale dei contenuti dei mondo Disney e offrire avanzate funzionalità di ricerca.

Denominata Content Genome (CG), la piattaforma permette di popolare i “grafici della conoscenza” (Knowledge Graph) che consentono di sfruttare la semantica associata alle parole cercate un oggetto e metetre in relazione gku oggetti in modo da avere una ricerca più veloce e accurata. Cosi come quando su Google cerchiamo “Steve Jobs” e appare il defunto CEO di Apple in vari contesti, spiega Engadget, così la ricerca semantica permette di associare informazioni e metadati in un formato adatto all’interrogazione e l’interpretazione (“Steve Jobs con un iPod in mano”, “Steve Steve con un MacBook in mano”, “Steve Jobs con il dolcevita”, ecc.).

Grazie ai grafici della conoscenza e alla ricerca semantica, le applicazioni di intelligenza artificiale possono sfruttare una serie di parametri per consentire di effettuare ricerche avanzate, rilevare dati, personalizzare in vari modi le ricerche e anche, come spiega Anthony Accardo, Direttore responsabile Ricerca e Sviluppo di DTCI, consentire di trovare riprese e sequenze specifiche dall’archivio Disney.

Disney ha ideato un avanzato sistema di riconoscimento facciale per l’animazione — Un fotograamma da Cars

“Se un animatore sta lavorando su una nuova stagione di Clone Wars e ha bisogno di individuare uno specifico tipo di esplosione avvenuto tre stagioni prima, un riferimento per qualcosa dell’attuale stagione, […] può semplicemente cercare la scena di cui ha bisogno usando i metadati”.

L’idea del progetto Content Genome è nata nel 2016; Accardo spiega che non è stato facile creare tutto da zero e che lo sviluppo di una funzionale e robusta tassonomia (classificazione delle frequenze e delle loro possibili combinazioni) è fondamentale, in particolare quando bisogna generare molti metadati diversi tenendo conto di molti attributi differenti. È necessario pensare a come gestire termini ed etichettare le cose, con il rischio di perdere il controllo sulla tassonomia.

Il team che ha lavorato sul progetto ha creato quello che descrive come la prima “pipiline di tagging automatico”, meccanismo che sfrutta l’apprendimento supervisionato, fondamentale per casi che richiedono specifici rilevamenti. Il particolare sistema di tagging consente di identificare vari elementi tenendo conto del contesto, dei personaggi di trame e motivazioni.

Riconoscere volti umani è tutto sommato semplice (due occhi, un naso e una bocca); molto più complesso è invece riconoscere volti di personaggi di cartoni come Monsters & Co. e altri ancora; è stato necessario addestrare il sistema di apprendimento automatico, adattandolo ai contenuti specifici del mondo Disney. Sono state usate varie tecnologie esistenti e vari algoritmi ad hoc per velocizzare i tempi di elaborazione e migliorare l’efficienza.

Il sistema di tagging non è del tutto automatico e serve ancora l’intervento umano ma la tecnologia sfruttata potrebbe permettere in futuro di effettuare ricerche di tutti i tipi anche agli utenti, individuando un personaggio minore in una serie, una particolare scena, le scene ambientate in un determinato contesto, una specifica scena di azione, ecc. Il team lavora anche sulla possibilità di riconoscere il ruolo di alcuni personaggi (es. identificando un logo su una maglietta di un personaggio o un ufficiale di polizia grazie al distintivo), permettendo di tenere conto di concetti non sempre specificatamente visibili o udibili. Tutto si basa sull’apprendimento automatico ma prima è necessario identificare perfettamente i contesti delle scene, i personaggi presenti e poi sfruttare la Multimodal PAML (Predictive Analytics and Machine Learning) che consene di analizzare ancora più a fondo i dati a supporto di molteplici paradigmi.

Per tutti gli articoli di macitynet che parlano di Intelligenza Artificiale fate riferimento a questo indirizzo.

Top offerte Apple su Amazon

Tags
Intelligenza Artificiale

Articolo precedente

Recensione Microsoft Surface Headphones 2, audio elegante, silenzioso e touch

Articolo successivo

Mobileye testa in Germania le auto a guida autonoma a 130 km/h

Disney ha ideato il riconoscimento facciale e metadati per l’animazione

Offerte Apple e Tecnologia

Top offerte Apple su Amazon

Su Amazon ancora ribassi per iPhone 15, ora al minimo storico con prezzo da 769€

Ultimi articoli

Mini proiettore per Home Cinema a soli 24,38 €

Phi-3 Mini è il sistema AI leggero di Microsoft pronto per gli smartphone

FLOOR ONE S7 FlashDry di Tineco, la pulizia con asciugatura rapida a bordo

AGCOM multa Amazon per gli acquisti periodici pre-impostati

L’Europa vuole obbligare i costruttori alle riparazioni fuori garanzia

Wacom Movink è il banco di lavoro OLED per creativi digitali

Multe stradali, i comuni che hanno incassato di più nel 2023

Offerte Amazon 24 aprile fino al 70% su Apple, elettrodomestici Samsung, realme, Beats, Philips, House of Marley

AAA Ancora di salvezza cercasi, Vision Pro vende metà del previsto

Blackview W50, smartwatch per uomini duri a soli 33,52 €

TONEX ONE è il pedale con AI per chitarra e basso

Tesla manca i risultati, promette robot su quattro ruote e due piedi

Disney ha ideato il riconoscimento facciale e metadati per l’animazione

Offerte Apple e Tecnologia

Top offerte Apple su Amazon

Altri articoli

Ultimi articoli