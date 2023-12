Google ha annunciato Gemini, presentata come la più potente suite di modelli AI mai creata dall’azienda, e c’è chi fa notare che alcune cose viste in un video dimostrativo non sono reali.

Bloomberg afferma che Google ha presentato in modo ingannevole alcune funzionalità in uno dei filmati dimostrativi, con l’IA che sembra fin troppo perfetta.

In un filmato di sei minuti che mostra le potenzialità multimodali di Gemini (la capacità, ad esempio, di tenere conto allo stesso tempo di conversazioni parlate e di riconoscere immagini), l’IA riconosce i disegni man mano abbozzati da un essere un mano, rispondendo in pochi secondi, riconoscendo colori, un oggetto esterno al disegno, l’oggetto collocato su una mappa, è in grado di comprendere se l’oggetto è in grad di galleggiare o no, creare un gioco, e riesce anche a indovinare dov’è nascosta una pallina di carta su tre bicchieri di plastica rovesciati sul tavolo (il classico gioco delle tre campanelle).

Sono tutte cose molto semplici per un essere umano ma non per una Intelligenza Artificiale, che sembra in grado di capire cosa succede e interagire di conseguenza.

Nel filmato di Google c’è un importante disclaimer: “Per le finalità di questo demo, la latenza è stata ridotta e gli output di Gemini sono stati ridotti per essere coincisi”.

Bloomberg sottolinea che si questo aspetto Biug G avrebbe dovuto essere più chiaro; chiedendo un commento all’azienda, Google ha confermato che le risposte non sono in tempo reale, che per creare il video sono state sfruttate immagini tagliate dal materiale girato e assemblate per far comprendere il senso delle potenzialità. “È qualcosa di molto diverso da quello che Google sembra suggerire”, spiega Bloomberg, riferendo che una persona che osserva il filmato potrebbe avere l’impressione di una possibile “conversazione fluida con Gemini”, che in altre parole “risponde in tempo reale al mondo circostante”.

Bisogna ricordare che molte aziende modificano video di questo tipo, specialmente quando non vogliono far notare lentezze e problematiche tecniche ma non è la prima volta che Google modifica filmati pubblicitari in modo discutibile.

Really happy to see the interest around our “Hands-on with Gemini” video. In our developer blog yesterday, we broke down how Gemini was used to create it. https://t.co/50gjMkaVc0 We gave Gemini sequences of different modalities — image and text in this case — and had it respond… pic.twitter.com/Beba5M5dHP — Oriol Vinyals (@OriolVinyalsML) December 7, 2023

Oriol Vinyals, vice presidente responsabile research and deep learning di Google, su X scrive che “Tutte le richieste utente e gli output mostrati nel video sono reali, abbreviati per concisione”, sottolineando che “il video illustra come l’esperienza utente multimodale creata con Gemini potrebbe apparire”, spiegando ancora che è stata fatta “per ispirare gli sviluppatori”.

