Stability AI, la società nota per Stable Diffusion, ha presentato una nuova famiglia di modelli dedicati all’audio generativo: Stable Audio 3.0. L’annuncio segna un’evoluzione significativa nel settore della musica creata con l’intelligenza artificiale, con sistemi capaci di produrre brani completi e strutturati di durata molto più estesa rispetto alle versioni precedenti.
Quattro modelli per usi diversi
La nuova linea comprende quattro modelli distinti: small SFX (459 milioni di parametri), small (459 milioni), medium (1,4 miliardi) e large (2,7 miliardi). I due modelli più leggeri sono pensati per la generazione di suoni ed elementi musicali direttamente su dispositivi, con una durata fino a due minuti.
Secondo l’azienda, i modelli medium e large sono invece in grado di generare composizioni complete fino a 6 minuti e 20 secondi, mantenendo coerenza melodica e struttura musicale. Si tratta di un miglioramento significativo rispetto a Stable Audio 2.0, rilasciato nel 2024, che si fermava a durate molto inferiori.
Un salto nella generazione musicale
Il punto centrale del nuovo sistema è la capacità di produrre musica più lunga e coerente. Stability AI sottolinea che i modelli avanzati possono mantenere struttura musicale e continuità armonica, un elemento cruciale per un utilizzo professionale.
Il passo avanti è rilevante anche rispetto a Stable Audio Open del 2024, che consentiva generazioni fino a 47 secondi. Con Stability Audio 3.0, l’azienda punta quindi a rendere la generazione musicale AI più vicina ai processi produttivi reali dell’industria musicale.
Apertura dei modelli e strategia commerciale
Stability AI ha reso disponibili con open weights i modelli small SFX, small e medium, permettendo così a sviluppatori e ricercatori di utilizzarli e modificarli liberamente. Il modello large, invece, sarà accessibile solo tramite API e servizi di self-hosting a pagamento.
Inoltre, le aziende con un fatturato superiore a 1 milione di dollari dovranno ottenere una licenza enterprise per l’utilizzo. Una scelta che evidenzia la volontà di bilanciare apertura tecnologica e sostenibilità commerciale.
Industria musicale e competizione crescente
Il settore dell’AI applicata alla musica è sempre più competitivo. Aziende come Google ed ElevenLabs stanno sviluppando strumenti simili, mentre realtà come Suno e Udio sono coinvolte in controversie legali legate all’uso dei dati e al copyright.
Stability AI ha già siglato accordi con Warner Music Group e Universal Music Group per lo sviluppo di strumenti musicali basati su AI, dichiarando che i nuovi modelli sono addestrati su dati completamente licenziati. Parallelamente, l’azienda sta costruendo una nuova divisione dedicata ai musicisti professionisti, guidata da Ethan Kaplan, ex chief digital officer di Universal Audio e Fender.
Fonte: TechCrunch