Amazon Alexa Plus è in dirittura di arrivo, Apple ha posticipato Siri con le funzioni AI più avanzate, mentre Google distanzia quasi tutti iniziando il rilascio delle funzioni AI video in tempo reale: quste permettono a Gemini di vedere per poter così rispondere alle domande contestuali.
Si tratta di un passo importante per il passaggio dai chatbot agli agenti AI, con modelli sempre più in grado di comprendere il contesto, oltre che di svolgere compiti e operazioni complesse con il minimo o nessun intervento da parte dell’utente.
Il dono della vista per Google Gemini riguarda sia la possibilità di vedere tutto ciò che appare sullo schermo, sia la visione tramite il flusso video della fotocamera dello smartphone. Ricordiamo che si tratta di funzioni che Big G aveva già mostrato in anteprima circa un anno fa sotto il nome di Project Astra e di cui aveva anticipato il rilascio all’inizio di marzo.
Come avviene per le funzioni AI più avanzate e complesse, che richiedono costoso tempo di calcolo, all’inizio la disponibilità delle funzioni AI video in tempo reale di Google Gemini è riservata solo ad alcuni abbonati al piano Google One AI Premium.
Alcuni video postati sui social dagli utenti mostrano le nuove funzioni video AI di Google Gemini in funzione. Al lancio un avviso informa che con questa funzione Google può accedere a qualsiasi dato o informazione che appare sullo schermo, consigliando all’utente di prestare attenzione a password, dettagli di pagamento, oltre che messaggi, foto, audio e video personali.

Una volta concessa l’autorizzazione. l’utente chiede a Google Gemini cosa vede sul display e il modello AI risponde offrendo una descrizione sintetica vocale. Allo stesso modo Google Gemini può rispondere a domande su ciò che vede nel mondo reale tramite il flusso video della fotocamera dello smartphone, come mostra un video di Big G che riportiamo in questo articolo.
La visione AI tramite fotocamera è già impiegata nei Ray-Ban Meta ed è considerata fondamentale per la prossima generazione di occhiali smart. In Italia e in Europa le funzioni AI più avanzate, vista inclusa, possono subire ritardi e posticipi per via delle egole sulla privacy.
In campo AI Google ha distanziato Apple e Amazon, ma le funzioni AI video sono arrivate prima per gli utenti di OpenAI. Tutti gli articoli che parlano di Intelligenza Artificiale sono nella sezione dedicata di macitynet.











