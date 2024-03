Finora i modelli di intellignza artificiale AI hanno dimostrato di poter generare testo, immagini e foto, persino musica e video: ora è il turno di Google di sbalordire ulteriormente il mondo con un nuovo prodigio AI battezzato Genie.

Deepmind, la sezione ricerca di Google dedicata all’AI, ha reso noto il nuovo progetto sperimentale che promette ulteriori meraviglie: si chiama Genie (nome che sta per “GENerative Interactive Environment”) ed è in grado di animare un’immagine statica, per creare una rappresentazione 3D, un ambiente esplorabile, navigabile e anche interattivo, arrivando di fatto a creare videogiochi a partire da una immagine o un testo.

Sul sito che annuncia il progetto sono presenti vari GIF che mostrano giochi tipo platform ottenuti partendo da immagini statiche (disegni di bambini, fotografie, ecc.) o prompt di testo dati in pasto a ImageGen2, dimostrando la possibilità di trasformare le immagini in ambienti navigabili in tutte le direzioni e tutto in tempo reale.

Con Genie potrebbe essere possibile creare esempi di giochi in tempo reale; il modello AI non crea, almeno per ora, codice e sprite utilizzabili dagli sviluppatori, ma crea delle animazioni ipotizzando i framework da generare per creare una animazione.

Genie riesce a mostrare esempi di giochi, perché è stato addestrato partendo da 200.000 ore di video game liberamente disponibili su internet, filtrati ulteriormente finché l’AI è stata in grado di “comprendere” il concetto di platform game 2D.

One amazing thing Genie enables: anyone, including children, can draw a world and then *step into it* and explore it!! How cool is that!?! We tried this with drawings my children made, to their delight. My child drew this, and now can fly the eagles around. Magic!🧞✨ https://t.co/qyWoT7O26I pic.twitter.com/EsEv6EkEds — Jeff Clune (@jeffclune) February 26, 2024

I “mondi” generati vengono creati sulla base dei dati sfruttati per l’addestramento, creando modelli dinamici che permettono di predire il comportamento dell’ambiente virtuale in base agli input dell’utente. Genie ha appresso ed è in grado di riconoscere i pattern e le dinamiche tipiche dei giochi 2D.

L’Ai interpreta le immagini di partenza come frame di un video e genera i frame successivi, “ipotizzando” quello che dovrebbe accadere sullo schermo (i frame successivo) in risposta a specifici input.

Come è facile immaginare, nonostante alcune limitazioni intrinseche, tutto questo apre nuove possibilità creative per sviluppatori e designer. Google ammette che vi sono dei limiti (si possono ottenere comportamenti irrealistici e anomali) ma il potenziale è interessante e l’AI, oltre a tutto quanto il resto, potrebbe rivoluzione anche il settore della creazione dei giochi, aggiungendo anche questo ramo degli sviluppatori all’elenco di quanti devono cominciare a preoccuparsi per il loro lavoro…

