Google cresce nell’intelligenza artificiale per descrivere le foto

Google rilascia il codice sorgente dell’intelligenza artificiale in grado di descrivere automaticamente, e con enorme precisione, una determinata immagine, riconoscendo soggetti, comportamenti e colori.

Seppur con qualche problema iniziale, l’intelligenza artificiale di Google applicata alle foto, in grado di  riconoscere e taggare automaticamente le immagini è cresciuta parecchio. La casa di Mountain View ha rilasciato agli sviluppatori il codice sorgente del proprio algoritm “Show and Tell”, che permette di riconoscere gli oggetti all’interno di una scena, con una percentuale di precisione del 93%.

Si tratta di un miglioramento significativo, dato che due anni fa la precisione di questo sistema si attestava all’89,6%. L’algoritmo non si limita a classificare le immagini a seconda di una categoria, ma descrive le foto in modo più preciso; a titolo di esempio, un modello di classificazione di immagine sarà in grado di dire se un cane è sull’erba e se sta giocando a frisbee. Non solo, l’algoritmo può anche dire di che colore è l’erba e in che posizione il cane si pone rispetto al frisbee.

google-show-and-tell-image-recognition-2016-09-23-01

Insomma, sembra che il team responsabile del progetto sia riuscito a creare un sistema completamente automatizzato, che nel modo più naturale possibile è in grado di generare descrizioni complesse delle immagini che vengono sottoposte. Foto in calce ne sono un chiaro esempio. In alcuni casi è in grado di riconoscere la posizione di un cane, non solo rispetto all’ambiente circostante, ma anche rispetto ad un altro cane ritratto in foto. In altre immagini, invece, l’algoritmo descrive la posizione di un treno, assegnando anche i giusti colori a vagoni ed altri oggetti in foto.

Il codice sorgente dell’algoritmo, per chi fosse interessato, può essere scaricato direttamente a questo indirizzo.

un orso o due orsi marroni che nuotano nell'acqua o stanno seduti sulle rocce