ElevenLabs rivoluziona la trascrizione vocale con Scribe

Capace di convertire l’audio in testo in ben 99 lingue diverse, Scribe offre tante altre funzionalità oltre alla trascrizione vocale

Redazione

La startup AI ElevenLabs porta l’innovazione nel settore della trascrizione automatica con Scribe, il suo primo modello di riconoscimento vocale che mira a competere contro le soluzioni targate OpenAI, Speechmatics e Deepgram.

ElevenLabs lancia il modello di riconoscimento vocale Scribe

Con Scribe, ElevenLabs punta a ridefinire gli standard della trascrizione automatica, affrontando sfide linguistiche ancora aperte e ampliando il proprio raggio d’azione oltre la generazione vocale.

In grado di supportare oltre 99 lingue (e oltre 25 con elevata accuratezza), Scribe si distingue per la sua capacità di cogliere sfumature e dettagli del parlato meglio rispetto ai modelli concorrenti. A confermarlo sono i risultati ottenuti nei test di benchmark FLEURS e Common Voice: secondo l’azienda, Scribe avrebbe battuto ampiamente in questi test non solo Gemini 2.0 Flash, ma anche il modello Whisper Large V3 di OpenAI.

Scribe, però, va oltre la semplice trascrizione testuale: il modello offre funzionalità avanzate come la diarizzazione intelligente (ovvero riesce a distinguere i diversi speaker in una registrazione) e la generazione di timestamp per ogni parola, rendendolo ideale per la creazione di sottotitoli accurati. Inoltre, è in grado di riconoscere alcuni particolari elementi come le risate del pubblico, migliorando così l’esperienza di trascrizione e sottotitolazione automatica.

Per saperne di più: Intelligenza artificiale: cos’è e come funziona, tutto sulla AI

Attualmente, Scribe funziona solo con i file audio pre-registrati e non supporta ancora la trascrizione in tempo reale, un elemento chiave per le riunioni o per la dettatura istantanea. Tuttavia, la startup ha dichiarato che sta lavorando a “una versione a bassa latenza per soddisfare queste esigenze in futuro.

Scribe viene proposto a un costo di 0,40 dollari per ogni ora di audio trascritto. Sebbene il prezzo sia competitivo, alcuni concorrenti offrono tariffe più basse con funzionalità differenti secondo Tech Crunch. Resta da vedere come ElevenLabs si posizionerà nel mercato rispetto a queste alternative e se l’elevata qualità del suo modello riuscirà a giustificare il prezzo.

Iscriviti alla newsletter

Non inviamo spam! Leggi la nostra Informativa sulla privacy per avere maggiori informazioni.