Questo sito contiene link di affiliazione per cui può essere compensato

Home » Hi-Tech » AI - Intelligenza Artificiale » Google DeepMind crea colonne sonore e dialoghi per qualsiasi video

Google DeepMind crea colonne sonore e dialoghi per qualsiasi video

Il laboratorio di intelligenza artificiale DeepMind di Google – Alphabet sta sviluppando una nuova tecnologia in grado di generare colonne sonore, e persino dialoghi, da utilizzare nei video. Il laboratorio ha condiviso i progressi del progetto chiamato video-to-audio (V2A), che può essere integrato con Google Veo e altri strumenti di creazione video come Sora di OpenAI.

Nel suo post sul blog ufficiale, il team di DeepMind spiega che il sistema può interpretare i pixel e combinare queste informazioni con suggerimenti testuali per creare effetti sonori in base a ciò che accade sullo schermo. È importante notare che lo strumento può anche essere utilizzato per creare colonne sonore per filmati tradizionali, come i film muti e qualsiasi altro video senza audio.

I ricercatori di DeepMind hanno addestrato la tecnologia utilizzando video, audio e annotazioni generate dall’intelligenza artificiale che contengono descrizioni dettagliate dei suoni e trascrizioni dei dialoghi. In questo modo, la tecnologia ha imparato ad associare suoni specifici a scene visive.

Il team di DeepMind non è il primo a rilasciare uno strumento di intelligenza artificiale che può generare effetti sonori, come osserva TechCrunch. Ed infatti, recentemente anche ElevenLabs ne ha rilasciato uno, che sicuramente non sarà l’ultimo.

Sebbene ci sia la possibilità di integrare suggerimenti testuali come opzionali, questo sistema può essere utilizzato per modellare e affinare il prodotto finale in modo che sia il più accurato e realistico possibile.

È possibile inserire suggerimenti positivi per indirizzare l’output verso la creazione dei suoni desiderati, oppure suggerimenti negativi per allontanarlo dai suoni indesiderati. Ad esempio, nel video campione fornito, il team ha utilizzato il suggerimento: “Cinematografico, thriller, film horror, musica, tensione, atmosfera, passi sul cemento.”

Google DeepMind sviluppa l'AI per creare dialoghi e colonne sonore

I ricercatori ammettono di essere ancora al lavoro per affrontare le limitazioni attuali della tecnologia V2A, come la riduzione della qualità audio che può verificarsi se ci sono distorsioni nel video sorgente. Il team, inoltre, sta lavorando per migliorare la sincronizzazione labiale per i dialoghi generati dall’AI. Inoltre, promette di sottoporre la tecnologia a “rigorose valutazioni di sicurezza e test” prima di rilasciarla al pubblico, così da scongiurare eventuali limitazioni o malfunzionamenti.

Tutte le notizie che parlano di Intelligenza Artificiale sono disponibili a partire da questa pagina di macitynet.

Offerte Apple e Tecnologia

Le offerte dell'ultimo minuto le trovi nel nostro canale Telegram

I consigli per i tuoi regali

CTA Natale iGuida [per Settimio] - macitynet.it
iGuide per i regali di Natale - macitynet.it

Regali di Natale e fine anno: i nostri consigli

Ogni anno testiamo le ultime novità del mercato, per poi raccogliere in articoli dedicati i migliori prodotti per ogni categoria. Queste guide, che aggiorniamo periodicamente, non solo vi permettono di migliorare la vostra attrezzatura ma, visto il periodo, diventano anche un ottimo spunto da cui partire per fare un regalo coi fiocchi ai propri cari.

A tal proposito le trovate organizzate qui sotto per tipologia, così da facilitarvi ulteriormente la ricerca del Regalo Perfetto. Le guide vengono modificate di continuo e fino a Natale vedrete man mano aggiungersi quelle che aggiorneremo.

Partiamo dai migliori:

Apple

iPhone e Smartphone

iPad e tablet

Mac e PC

Apple Watch e Smartwatch

Fotografia e Creatività

Viaggiaresmart

Audio e Video

Intrattenimento

Vita in casa

Pubblicità
Pubblicità

Ultimi articoli