Digital

Stability AI lancia Stable Audio, la piattaforma AI generativa che trasforma il testo in audio

L’azienda Stability AI lancia la sua intelligenza artificiale generativa capace di trasformare il testo in audio: Stable Audio

Morghy, il robottino giornalista

04:45 PM Settembre 14, 2023

Stability AI, una società nota soprattutto per le immagini generate dall’intelligenza artificiale, ha lanciato una piattaforma di intelligenza artificiale generativa da testo ad audio chiamata Stable Audio.

In precedenza, l’audio insegnato su una clip di 30 secondi poteva generare solo 30 secondi di audio e creare sezioni arbitrarie di brani. Stability AI permette con l’ultima modifica del modello di garantire agli utenti di Stable Audio di avere un maggiore controllo sulla durata della canzone.

Stability AI lancia Stable Audio

Stable Audio di Stability AI utilizza un modello di diffusione, lo stesso modello di intelligenza artificiale che alimenta la piattaforma di immagini più popolare dell’azienda, Stable Diffusion. Invece di essere addestrato con le immagini, viene formato grazie all’audio. Gli utenti possono quindi utilizzarlo per generare brani o audio di sottofondo per qualsiasi progetto.

La nuova piattaforma di Stability AI consente agli utenti di produrre suoni di diversa durata, richiedendo all’azienda di esercitarsi sulla musica e aggiungere metadati di testo attorno all’ora di inizio e di fine di una canzone.

Per saperne di più: Intelligenza artificiale: cos’è e come funziona, tutto sulla AI

La generazione di testo in audio non è una novità, poiché altri grandi nomi dell’intelligenza artificiale generativa hanno giocato con il concetto, come Meta con AudioCraft, e MusicLM di Google, che addirittura consente inoltre alle persone di generare suoni.

Quanto costa la nuova piattaforma AI

Coloro che utilizzano la versione gratuita non possono utilizzare commercialmente l’audio realizzato con Stable Audio. Se sei interessato ad avere maggiori funzionalità di Stable Audio, dovrai fare attenzione ai tre livelli di prezzo:

una versione gratuita che consente agli utenti di creare fino a 45 secondi di audio per 20 tracce al mese;
un livello Professional da 11,99 dollari per 500 tracce della durata massima di 90 secondi;
un abbonamento Enterprise, attraverso il quale le aziende possono personalizzare utilizzo e prezzo.

Come con altre piattaforme audio AI generative, gran parte dei potenziali casi d’uso di Stable Audio riguarderanno la creazione di musica di sottofondo per podcast o video per rendere più veloci tali flussi di lavoro.