Sapir, un motore per cercare materiale audiovisivo senza TAG

di |
logomacitynet696wide

Un motore di ricerca capace di analizzare e identificare i pixel in grandi archivi audiovisivi. Un progetto dell’Unione Europea guidato dalla divisione ricerca di IBM grazie al quale è possibile trovare video, immagini, musica e altro materiale non contrassegnato con TAG.

E se trovare parti di ricambio o identificare un punto di riferimento fosse tanto facile quanto caricare e analizzare una foto digitale? Presto sarà  possibile grazie alla tecnologia sviluppata da un progetto dell’Unione Europea guidato dalla divisione di Ricerca IBM.

In collaborazione con un Consorzio dell’Unione Europea, alcuni ricercatori hanno sviluppato un motore di ricerca analitico che consente di trovare video, immagini e musica, non contrassegnati con informazioni descrittive (tag), che corrispondano a dati multimediali sottoposti come query.

Il consorzio ha ideato una tecnologia Web denominata SAPIR (Search in Audio visual content using Peer-to-peer Information Retrieval) capace di analizzare e identificare i pixel in grandi archivi costituiti da contenuti audiovisivi. Ad esempio, è in grado di analizzare una foto digitalizzata o i bitstream in un file audio elettronico anche se non sono stati contrassegnati o indicizzati con tag. Il multimedia identificato viene automaticamente indicizzato e ordinato per essere poi facilmente recuperato.

Il sistema è in grado di indicizzare e analizzare archivi costituiti da milioni elementi multimediali, estraendo i “descrittori base” da fotografie o video. Questi descrittori comprendono caratteristiche quali il colore, il layout, le forme o i suoni.

Se, ad esempio, un turista usa un telefono cellulare per fotografare una statua, SAPIR ne identifica i descrittori, li confronta con le fotografie esistenti e aiuta a identificare la statua. Con ulteriori ricerche, potrebbero essere analizzate caratteristiche più specifiche, in modo tale che, ad esempio, potrebbe essere possibile fotografare un elemento di abbigliamento alla moda, visto in qualche vetrina, e scoprire in quali negozi poterlo acquistare. In futuro, i ricercatori potrebbero essere in grado di estendere la potenza della scalabilità  e usarlo, ad esempio, come ausilio nell’assistenza sanitaria analizzando immagini mediche e documentazioni dei pazienti per proporre diagnosi verosimili confrontando i risultati con dati storici estratti da archivi medici distribuiti.

I file multimediali costituiscono la stragrande maggioranza dei dati disponibili su Internet e, da uno studio di IDC del maggio 2009, emerge che il 95% delle informazioni in formato elettronico, come ad esempio le foto digitali, non è ben categorizzato o identificato da tag. Le immagini, catturate da più di 1 miliardo di dispositivi nel mondo, costituiscono la parte maggiore dell’universo digitale. Ad esempio, nel 2006 il numero d’immagini raccolte con telefoni cellulari ha quasi raggiunto i 100 miliardi e si prevede che si arrivi a 500 miliardi entro il 2010.

SAPIR attinge i suoi dati in questo vasto repertorio elettronico multimediale in continua crescita ed ha – secondo i realizzatori – un’affidabilità  eccezionale e capacità  pressoché illimitate. E’ basato sulla stessa architettura peer-to-peer che viene utilizzata anche per lo scambio di audio e video su Internet. Con questo approccio, non esiste un singolo elemento che, a seguito di un guasto, possa portare al malfunzionamento dell’intero sistema ed è possibile aggiungere risorse per aumentarne la capacità  a fronte di un aumento dei dati da analizzare. La “freschezza” del materiale indicizzato e ordinato è garantita dal fatto che i provider di contenuti inseriscano automaticamente il proprio materiale nell’archivio.

Un demo di prova per il pubblico è disponibile all’indirizzo http://sapir.isti.cnr.it/index.
[A cura di Mauro Notarianni]