Fino ad oggi si poteva interagire con ChatGPT soltanto scrivendo nell’apposita casella testuale, ma le cose sono appena cambiate: l’ultima versione del celebre chatbot infatti può anche ascoltare le richieste tramite voce o attingere dalle immagini che decidiamo di fargli esaminare, così da avere a disposizione un più versatile assistente governato dall’intelligenza artificiale.

È la prima volta che OpenAI apporta una modifica di questo tipo: da quando è stato rilasciato sul mercato, ChatGPT è stato migliorato soltanto dal punto di vista delle sue capacità, aggiungendo cioè le cose che il bot è stato in grado di fare. Invece entro le prossime due settimane sottoscrive (o già possiede) l’abbonamento premium ha accesso a queste due ulteriori opzioni.

Come funzionano i comandi vocali

Il sistema vocale è proprio come ce lo si aspetta: si schiaccia un pulsante e si detta la richiesta, che verrà poi elaborata come al solito, ma la risposta oltre che testuale sarà anche letta ad alta voce dal bot. In pratica dovrebbe essere un po’ come parlare con Siri, Alexa o l’Assistente Google, solo che le risposte saranno ovviamente migliori per via degli algoritmi avanzati a disposizione di ChatGPT.

Secondo OpenAI l’ultima versione del sistema di sintesi vocale Whisper, quello che converte il testo in audio, è in grado di generare una risposta audio di alta qualità, molto «simile alla voce umana». Quel che più stupisce è che riesce a sintetizzare la voce usando una base campione di pochi secondi, il che secondo alcuni apre le porte a potenziali abusi, come quello di generare discorsi mai esistiti utilizzando la voce di personaggi pubblici.

Proprio per questo motivo si sarebbe limitato l’uso ai soli abbonati, e anche in questo caso – dicono – alla base c’è un controllo profondo proprio per evitare possibili frodi.

Come funziona la ricerca tramite immagini

Il sistema di ricerca tramite immagini invece è qualcosa di molto simile al Google Lens: in sostanza si carica una immagine e si fa una domanda inerente al contesto (ad esempio si potrebbe chiedere marca e modello di una particolare maglietta indossata da uno dei soggetti) da lì ChatGPT dovrebbe essere in grado di analizzare il file e rispondere correttamente.

È anche possibile aiutare il bot a capire di cosa si sta parlando cerchiando l’oggetto in questione tramite matita digitale, in modo da affinare la ricerca e aiutare il bot a migliorare questo nuovo strumento.

Anche qui OpenAI starebbe integrando un sofisticato sistema di sicurezza per impedire che si possa usare la ricerca tramite immagini per invadere la privacy degli utenti, ad esempio chiedendo di identificare una particolare persona da una foto di gruppo.

