La startup AI ElevenLabs presenta Turbo 2.5, un nuovo modello avanzato di sintesi vocale a bassa latenza che, con il supporto di ben 32 lingue (italiano compreso), offre prestazioni migliorate per tutte le aziende che desiderano integrare funzionalità vocali nei propri prodotti e servizi.
Come funziona Turbo 2.5 di ElevenLabs
Con Turbo 2.5, ElevenLabs offre alle aziende di terze parti la possibilità di sviluppare bot conversazionali avanzati e di integrarli in vari dispositivi hardware, come ad esempio gli occhiali smart in stile Ray-Ban Meta. Inoltre, Turbo 2.5 trova applicazione anche nel mondo dei videogiochi, rendendo i personaggi più realistici e interattivi.
Per saperne di più: Intelligenza artificiale: cos’è e come funziona, tutto sulla AI
La generazione di testo-voce con l’intelligenza artificiale è un’area in continua evoluzione. Infatti, oltre a ElevenLabs, anche altre aziende stanno lavorando su nuove applicazioni di sintesi vocale basate sull’intelligenza artificiale.
È il caso di OpenAI, che ha recentemente offerto un accesso limitato alla sua piattaforma di generazione di testo-voce, Voice Engine, che permette di fornire voci preimpostate per l’API di sintesi vocale e per la funzione di lettura ad alta voce di ChatGPT.
Gli sviluppatori interessati possono accedere all’API di Turbo 2.5 visitando la pagina ufficiale di ElevenLabs.
Nuove funzionalità e partnership
Come già anticipato, Turbo 2.5 ora è capace di elaborare lingue come l’italiano, il francese, lo spagnolo, il mandarino e altre 27 lingue a una velocità tre volte superiore. Anche l’inglese beneficia di un incremento significativo, con un miglioramento del 25% nella velocità di elaborazione.
Ma oltre al supporto linguistico, ElevenLabs rende disponibile anche l’API Voice Isolator, uno strumento che permette grazie all’AI di eliminare il rumore di fondo dalle registrazioni audio, isolando i dialoghi in modo pulito.
In una dimostrazione pratica, è stato realizzato un sito web con l’aiuto di Claude di Anthropic, dove gli utenti possono inserire un link di YouTube e utilizzare l’API Voice Isolator per rimuovere il rumore di fondo, ottenendo un audio pulito direttamente riproducibile dal browser.