NotebookLlama, la risposta di Meta a NotebookLM di Google

NotebookLlama promette di trasformare semplici file di testo in conversazioni coinvolgenti, ma i risultati non sono ancora del tutto convincenti

morghy il robottino giornalista
Morghy, il robottino giornalista
meta

In futuro non ci si affiderà solo a NotebookLM di Google per la creazione di podcast. Infatti la società di Zuckerberg ha lanciato recentemente NotebookLlama, una specie di NotebookLM che sfrutta i modelli di intelligenza artificiale Llama di Meta per convertire documenti di testo, come articoli o post di blog, in contenuti audio. Tuttavia, i risultati ottenuti, seppur innovativi, mostrano ancora limiti evidenti.

Come funziona NotebookLlama

Riprendendo quanto già riportato dal sito di informazione TechCrunch sulla base dei file presenti sulla piattaforma GitHub, il processo di generazione dei podcast con NotebookLlama si articola in diverse fasi.

Inizialmente, il sistema trascrive il file caricato dall’utente, che può essere un PDF di un articolo di giornale o un post di blog.

Questa trascrizione viene poi arricchita con elementi di “drammatizzazione” (dramatization), come interruzioni e pause, per rendere la conversazione più dinamica.

Infine, il testo viene inviato a modelli di text-to-speech open-source, che si occupano della generazione dell’audio finale.

Per saperne di più: Intelligenza artificiale: cos’è e come funziona, tutto sulla AI

Cosa cambia rispetto a NotebookLM di Google

Nonostante l’avanzata tecnologia utilizzata, NotebookLlama di Meta ha ancora molta strada da fare prima di diventare come la controparte firmata Google. Anche perché NotebookLM crea podcast con voci molto realistiche, mentre NotebookLlama crea al momento podcast con voci troppo artificiali, che tendono addirittura a sovrapporsi in momenti imprevisti.

Riferisce TechCrunch, i ricercatori di Meta sono ottimisti sul fatto che la qualità dell’audio possa essere migliorata grazie a modelli più avanzati. Peccato che, se utilizzano ancora i modelli text-to-speech, rischiano di rimanere indietro rispetto a NotebookLM. Infatti, uno dei principali limiti risiede nei modelli in questione, che influiscono sulla naturalezza delle voci generate.

Sempre i ricercatori hanno proposto un approccio alternativo per la creazione dei podcast, ovvero l’utilizzo di due agenti AI distinti in grado di dialogare e dibattere sull’argomento del podcast, così da poter sviluppare una conversazione meno monotona e artificiale.

Iscriviti alla newsletter

Non inviamo spam! Leggi la nostra Informativa sulla privacy per avere maggiori informazioni.