Se prima erano solo le immagini, ora anche i video potranno essere generati dall’intelligenza artificiale. E questo sarà possibile nel nuovo modello AI di Stability, Stable Video Diffusion (SVD).
Si tenga presente che il modello in questione è attualmente solo a scopo di ricerca. Coloro che desiderano utilizzare la SVD dovranno contattare Stability AI per richiedere l’accesso.
Stable Video Diffusion, il modello AI generativo per video
I creatori del generatore di immagini AI, Stability, stanno entrando nel mondo dei video AI generativi con un nuovo prodotto chiamato Stable Video Diffusion.
Esistono molti diversi modelli di generatori di immagini AI Stable Diffusion e la società, Stability AI, sta mantenendo questa pratica rilasciando questo modello di generatore video AI. Come riporta Engadget, questo strumento all’avanguardia rappresenta un passo significativo nella creazione di modelli AI per tutti. Anche se ancora è alquanto limitata.
Il modello può generare video piuttosto brevi (quattro secondi) e non raggiunge un fotorealismo sempre perfetto. In compenso, SVD può generare 14 fotogrammi di video, mentre la versione SVD-XT può generare 25 fotogrammi di video. I fotogrammi al secondo possono essere personalizzati da 3 a 30 fotogrammi al secondo, con una risoluzione di 576×1024.
Engadget rileva che lo strumento di conversione del testo in video è stato addestrato su un set di dati dell’ordine di milioni di video, che sono stati poi perfezionati su un insieme più piccolo.
Attualmente il modello può generare video senza movimento o panoramiche molto lente. Il modello non può essere controllato tramite testo, e non può rendere il testo leggibile. Inoltre, i volti e le persone in generale potrebbero non essere generati correttamente.
Il problema delle immagini sotto copyright
La fonte dei dati per i video di Stable Video Diffusion è un problema spinoso. Per il suo modello, Stability AI ha solo affermato di aver utilizzato dati “disponibili al pubblico”. Si tratta di un termine comune che le aziende di intelligenza artificiale utilizzano per descrivere genericamente da dove ottengono i dati di addestramento.
Come segnala Engadget, per il suo generatore di immagini AI, Stability AI ha utilizzato il set di dati LAION per alcuni dei suoi dati di addestramento, il che ha portato a una causa legale con Getty Images.
Stable Video Diffusion cercherà di competere con aziende del calibro di Runway ML in un mercato che non è ancora decollato come l’AI generativa per video e immagini.
Ciò è dovuto in gran parte al fatto che la qualità della tecnologia non è ancora stata raggiunta. Inevitabilmente migliorerà nei prossimi anni, anche se rimane ancora oggi il rischio di deepfake e violazioni del copyright.