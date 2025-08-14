Normalmente per usare Sora serve un abbonamento a ChatGPT, ma se passate attraverso Bing è tutto gratis. Ve ne avevamo già parlato a giugno, quando Microsoft aveva reso pubblica questa possibilità. All’epoca il servizio era circoscritto all’app Microsoft Bing per iPhone e iPad, ma già da qualche settimana vi si può accedere anche direttamente da Mac e PC tramite browser.

Panoramica, per chi va di fretta

Per generare video AI gratis con Sora da Mac e PC fate così:

Andate su https://bing.com/create effettuate l’accesso col vostro account Microsoft cliccate su Video descrivete la scena che volete realizzare nel menu delle opzioni, lasciate Velocità se avete crediti disponibili, altrimenti cliccate su Standard cliccate su Crea

Oppure da smartphone e tablet:

aprite l’app Ricerca Microsoft Bing per iPhone, iPad o Android cliccate sul menu in basso a destra selezionate Video Creator (adesso saltate al punto 4 descritto qui sopra)

Spiegazione, per chi vuole capire

OpenAI ha presentato Sora a febbraio 2025 e attualmente per usarlo serve un abbonamento a ChatGPT, ma se si sceglie di accedervi tramite Microsoft Bing allora non dovete pagare nulla.

Questo perché l’azienda ha fin da subito sostenuto OpenAI in cambio dell’accesso alla sua tecnologia, il che gli ha permesso – tra le altre cose – di introdurre lo strumento Video Creator basato appunto sulle tecnologie AI di Sora.

Perché non usare ChatGPT

Ad essere precisi tramite ChatGPT l’utilizzo di Sora è limitato a 50 video (1.000 crediti) con risoluzione massima di 720p e una durata di 5 secondi.

Dopodiché serve abbonarsi a ChatGPT Plus (20 € al mese) o Pro (200 € al mese) e a quel punto i video prioritari diventano 500, in risoluzione Full HD e con una durata massima di 20 secondi. Inoltre sottoscrivendo un abbonamento se ne possono generare fino a cinque contemporaneamente, senza watermark e senza limiti nel numero totale di video generabili.

Con Microsoft invece è tutto gratis

Passando per il servizio Bing di Microsoft è possibile usare Sora per generare contemporaneamente fino a tre video: se tutti e tre gli slot sono occupati allora bisognerà attendere che uno finisca prima di iniziarne un altro.

Quando un video è pronto si riceve una notifica. I video creati in questo modo durano fino a 5 secondi e sono in formato verticale in 9:16. Come scrivevamo in occasione dell’annuncio, prossimamente sarà anche possibile scegliere il formato orizzontale in 16:9.

Questi video si possono poi scaricare e condividere con chi si vuole, e soprattutto non ci sono limiti nel numero di video generabili tramite l’opzione Standard, che richiede diverse ore di elaborazione per ciascun video.

Se invece si opta per la modalità Veloce le prime 10 generazioni video sono gratuite e ciascuna viene portata a termine nel giro di pochi minuti. Dopodiché ogni 100 punti Microsoft Rewards si possono ottenere altre 10 generazioni video veloci. Questi punti si guadagnano effettuando ricerche tramite Bing, comprando contenuti sullo store di Microsoft, giocando con Xbox e via dicendo (maggiori dettagli sul sito ufficiale Microsoft).

Come creare il giusto prompt

Per ottenere un buon video serve un buon prompt, ovvero la descrizione giusta per permettere all’AI di avvicinarsi quanto più possibile a ciò che abbiamo figurato nella nostra mente.

Microsoft consiglia innanzitutto di essere descrittivi perché più si va nello specifico, migliori saranno risultati. Riporta l’esempio di un prompt in cui compare la frase “una giovane donna con un cappotto rosso che cammina in una foresta innevata all’alba” piuttosto che scrivere un generico “una persona che cammina”. Aggiungere dettagli è la chiave per ottenere il video desiderato, anche descrivendo cose come il tipo di illuminazione e l’angolo di ripresa della telecamera.

Una buona idea – dicono – è poi quella di indicare uno stile, ad esempio aggiungendo nel prompt un “nello stile di un trailer cinematografico” oppure “come un cartone animato” in base a ciò che si vuole ottenere.

In aggiunta noi vi consigliamo di scrivere il prompt in inglese perché, a parità di descrizione, gli algoritmi attuali tendono a interpretare meglio i testi scritti in questa lingua (questo accade perché la maggior parte dei testi con cui le AI sono state addestrate sono scritti in inglese).

E ricordatevi che al momento sono supportati soltanto testi descrittivi inferiori ai 600 caratteri.

P.S. Aggiungiamo un ultimo consiglio, che è quello di scrivere prompt semplici: ma di questo ne parliamo meglio a fine articolo.

Come va

Abbiamo provato la versione Standard per capire quanto è precisa l’AI e in quanto tempo riesce a generare i video. Con questo prompt (414 caratteri):

Realistic cinematic video of a futuristic Apple store in the heart of a modern city at sunset. Sleek glass architecture, minimalistic interior with glowing Apple logos, interactive holographic displays showing new Apple devices: iPhone, MacBook, Apple Watch. People of diverse backgrounds testing devices. Clean, modern, elegant style. Subtle lens flare, shallow depth of field, smooth camera movement, 4K quality.

Il sistema ha impiegato più di 5 ore, e questo è il risultato. Più della metà delle richieste sono state esaudite: le luci al tramonto ci sono, la città si può dire moderna e il negozio non si può certo dire che non abbia un design minimalista.

Ci sono anche i display olografici e i movimenti fluidi della fotocamera, tuttavia il difetto di prospettiva è evidente, il negozio appare fin troppo piccolo rispetto alle persone sullo sfondo. Altro errore grave sta nella comparsa della prima persona sullo sfondo che, dopo essere entrata nell’inquadratura, balza in primo piano attraverso un fluido movimento che la fa crescere di almeno 40 centimetri in una frazione di secondo.

In un secondo tentativo abbiamo ridotto il numero di caratteri (187) e cambiato lo stile, cercando di mantenere una descrizione più snella ma sempre precisa:

Comic-style rocket shaped like an iPhone launches into the sky with fire and smoke, leaving a glowing Apple logo in the clouds. Dynamic panel layout, bold ink lines, vibrant comic colors.

Anche in questo caso ci sono volute più di cinque ore, e questo innanzitutto significa che la lunghezza del prompt non influisce sulla durata di elaborazione. Il risultato invece lo potete vedere qui: questa volta è andata abbastanza bene perché l’effetto grafico del fumetto è stato colto fin troppo, datosi che il logo Apple che compare nel fumo viene mostrato attraverso una nuova scenetta – e non in una vera e propria animazione.

In una terza prova abbiamo mantenuto lo stile del fumetto chiedendo all’AI di creare una scena diversa. Il prompt è un po’ più dettagliato (301 caratteri) e lo potete leggere qui sotto:

A stylized comic book scene, close-up of a shiny red apple on a table, dramatic lighting, bold comic-style shadows and halftone texture. Suddenly, a cartoon lightning bolt strikes the apple, and it transforms into a sleek iPhone, glowing. Bright colors, dynamic action lines, comic “ZAP!” text bubble.

Imitazione del prompt di Microsoft

Cliccando qui potete vedere la clip generata da Sora. Anche questa volta il contesto generale è stato colto, ma nel prompt abbiamo forse dato troppi dettagli perché l’AI non è riuscita a portare a termine la richiesta. La scena da fumetto c’è, l’ambientazione pure, ma mancano sia il fulmine che la trasformazione della mela in un iPhone.

Nel post sul blog che annuncia la disponibilità del servizio, Microsoft mostra un prompt di esempio: “In a busy Italian pizza restaurant, a small otter works as a chef and wears a chef’s hat and an apron. He kneads the dough with his paws and is surrounded by other pizza ingredients.”

Abbiamo provato ad attenerci a questa indicazione per costruire tre prompt similari.

Il più riuscito della terna è questo:

On a high-speed train racing through an ultramodern city, a sleek fox works on its MacBook Pro while neon lights and glass skyscrapers blur past the windows.

Nel filmato, che potete vedere cliccando qui, l’unico difetto infatti risiede nello scorrimento del paesaggio sullo sfondo, che non è perfettamente realizzato. Tutto il resto invece è stato centrato in pieno.

Vi mostriamo infine anche gli altri due prompt, vicini nello stile, ma grossolani dal punto di vista della realizzazione. Non tanto per l’effetto grafico, quanto per la “comprensione del testo”.

Ad esempio in “In a silent, modern library, a studious owl uses an iPad with an Apple Pencil to take notes. Around it, shelves of books and a clean, minimalist Apple-style interior.” manca totalmente l’uso del tablet e dello stilo, mentre nel prompt “In a futuristic Apple Store hidden in the jungle, a little monkey wears an Apple Vision Pro headset and interacts with floating holograms. Around it, nature blends seamlessly with technology.” manca l’interazione con gli ologrammi.

Conclusioni

Scrivere il giusto prompt è possibile ed è dimostrato dai “best of” che Microsoft raccoglie e mostra nella pagina di accesso a questa tecnologia, ma il risultato non è mai scontato.

Difficilmente infatti si riesce a vedere realizzata completamente l’idea che si ha in testa al primo o al secondo colpo, e in questo senso la semplicità è l’ultimo consiglio che ci sentiamo di aggiungere all’elenco delle cose da tenere a mente nella costruzione di un prompt. Date la priorità a pochi (ma precisi) dettagli e sarà più facile ottenere un buon video: troppa carne al fuoco rischia invece di far perdere la bussola all’AI.

Sicuramente questa tecnologia migliorerà ed è quindi lecito aspettarsi che in un futuro non molto lontano, a parità di prompt, sarà possibile realizzare video complessi, con una maggiore precisione e una più alta probabilità di riuscita.

Nel momento in cui scriviamo il livello raggiunto dai 5 secondi offerti gratuitamente da Microsoft con Sora offrono una buona libertà creativa, ma con molti compromessi da accettare.

