In questi primi giorni di agosto Meta continua a presentare novità. Tra le più recenti vi è AudioCraft, il suo nuovo modello di intelligenza artificiale generativa realizzata per creare musica ed effetti sonori.
AudioCraft, l’AI musicale
In realtà AudioCraft si compone di tre diversi modelli. Il primo è il già noto MusicGen in grado di creare musica grazie al suo addestramento avvenuto su oltre 20.000 ore di canzoni di proprietà di Meta.
Il secondo, invece, è la prima novità e si chiama AudioGen. Il modello di AI si occupa di creare gli effetti sonori, dal cane che abbaia alla porta che sbatte. In questo caso l’addestramento è avvenuto utilizzando le librerie degli effetti sonori liberamente accessibili al pubblico. Questi primi due modelli di AudioCraft funzionano proprio come ChatGPT ovvero l’utente inserisce un testo e la macchina lo lavora generando musica o suoni. Diverso è invece EnCodec che si occupa, invece, di analizzare l’output degli altri due modelli e lo ripulisce da eventuali imperfezioni.
“Con AudioCraft, semplifichiamo la progettazione complessiva di modelli generativi per l’audio rispetto al lavoro precedente sul campo, offrendo alle persone la ricetta completa per giocare con i modelli esistenti che Meta ha sviluppato negli ultimi anni, consentendo loro anche di spingersi oltre i limiti e sviluppare i propri modelli. Vediamo la famiglia di modelli AudioCraft come strumenti per musicisti e sound designer per fornire ispirazione, aiutare le persone a fare rapidamente brainstorming e iterare le loro composizioni in modi nuovi. Non vediamo l’ora di vedere cosa creano le persone con Audiocraft”, ha dichiarato Meta in una nota stampa ufficiale di presentazione.