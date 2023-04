Ricercatori della Cornell University hanno sviluppato occhiali sonar in grado di “ascoltare” l’utente senza che questo debba per forza pronunciare parole ad alta voce; l’accessorio in questione è in grado di comprendere parole pronunciate anche a bassa voce; due piccoli microfoni e speaker consentono di interpretare comandi che possono essere utili ad esempio per mettere in pausa un brano, passare al brano successivo, indicare una password e così via, senza toccare il telefono, ma anche lavorare con applicazioni (es. modelli CAD) senza bisogno della tastiera per impartire determinati comandi.

Il sistema è stato sviluppato principalmente da Ruidong Zhang, dottorando della Cornell, è stato denominato EchoSpeech e al contrario di altre tecnologie che richiedono fotocamere per il riconoscimento del labiale, il sistema sonar richiede pochi minuti di addestramento iniziale (es. la lettura di una serie di numeri) per il riconoscimento dei modelli vocali di un utente. È in grado di inviare e ricevere onde sonore sul/dal volto e intrepretare i movimenti della bocca grazie ad algoritmi di deep learning che analizzano i profili dell’eco in tempo reale, con un tasso di accuratezza che arriva, secondo gli sviluppatori, “al 95%”.

Il sistema si appoggia allo smartphone per l’elaborazione dei dati ma questa avviene in modalità trasparente (senza che l’utente si accorga di nulla), permettendo di mettere a disposizione un accessorio di piccole dimensioni e non appariscente.

L’attuale versione di questi particolari occhiali offre circa 10 ore di autonomia per la sensoristica acustica; non viene memorizzato nessun dato e dunque non comporta nessuna problematica sul versante privacy. Oltre che per utilizzi semplici che possono essere di interesse per tutti, il dispositivo potrebbe essere interessante anche per persone affette da alcune disabilità del linguaggio, rilevamento movimenti con i quali attivare, ad esempio, un sintetizzatore vocale.

Il team dello Smart Computer Interfaces for Future Interactions (SciFi) Lab della Cornell University sta valutando la possibile commercializzazione della tecnologia sfruttando un programma di finanziamento dell’università.