Google SynthID Text, il nuovo tool per identificare i contenuti AI

Negli ultimi anni, la crescita esponenziale dell’intelligenza artificiale ha portato allo sviluppo di strumenti sempre più sofisticati per generare contenuti testuali, con conseguenti implicazioni nel campo dell’informazione, della disinformazione e della trasparenza digitale. In questo contesto, Google ha recentemente rilasciato SynthID Text, una tecnologia che mira a rendere più facile l’identificazione dei testi generati da AI attraverso l’uso di filigrane digitali (watermark).

Come funziona SynthID Text

Simile alla versione video lanciata l’anno scorso, SynthID Text è una tecnologia avanzata che prevede l’inserimento di un watermark digitale invisibile all’interno dei testi generati dall’intelligenza artificiale. Esso avviene attraverso la manipolazione della distribuzione dei token, gli elementi utilizzati dai modelli di AI per elaborare e generare contenuti testuali.

In pratica, viene modulata la probabilità che determinati token vengano selezionati dal modello, senza che ciò comprometta la qualità, la coerenza o la velocità di generazione del testo. Il risultato è un pattern di punteggi che può essere confrontato, come precisa Google,

“[…] con il modello previsto di punteggi per il testo sotto watermark e non. Tutto ciò permette a SynthID di rilevare se uno strumento di intelligenza artificiale ha generato il testo o se potrebbe provenire da altre fonti”.

Per saperne di più: Intelligenza artificiale: cos’è e come funziona, tutto sulla AI

Disponibilità e limiti di Google SynthID Text

Google DeepMind, la sviluppatrice della tecnologia in questione, ha precisato in un suo post su X che SynthID Text è ora disponibile per sviluppatori e aziende tramite piattaforme come Hugging Face e il Google Responsible Generative AI Toolkit.

Today, we’re open-sourcing our SynthID text watermarking tool through an updated Responsible Generative AI Toolkit.

Available freely to developers and businesses, it will help them identify their AI-generated content. 🔍

Find out more → https://t.co/n2aYoeJXqn pic.twitter.com/4uRKYaz57Y
— Google DeepMind (@GoogleDeepMind) October 23, 2024

Riferisce il sito di informazione The Verge, il sistema è già integrato nel chatbot Google Gemini, e non compromette la qualità, l’accuratezza, la creatività o la velocità del testo generato.

Nonostante la sua efficacia, Google riconosce che ci sono dei limiti: ad esempio, SynthID Text può avere difficoltà a rilevare la provenienza di testi molto brevi, riscritti o tradotti, così come risposte a domande concrete.

La corsa al watermarking

Google non è l’unica azienda a lavorare su tecnologie di watermarking per contrassegnare i contenuti generati da AI. Anche OpenAI ha esplorato metodi simili, ma ha rinviato il loro rilascio, precisa il sito di informazione Tech Crunch, “per motivi tecnici”.

L’adozione di tali tecniche potrebbe risolvere molti dei problemi legati ai rilevatori di contenuti AI, spesso accusati di segnalare erroneamente testi generici come creati dall’intelligenza artificiale.

Ciò che non è ancora chiaro, tuttavia, è se queste tecnologie di watermarking saranno adottate su larga scala. Le varie aziende stanno proponendo soluzioni diverse, ma non esiste ancora uno standard univoco che prevalga sugli altri.

Google SynthID Text, il nuovo tool per identificare i contenuti generati dall’AI

Come funziona SynthID Text

Disponibilità e limiti di Google SynthID Text

La corsa al watermarking

Iscriviti alla newsletter

Come funziona SynthID Text

Disponibilità e limiti di Google SynthID Text

La corsa al watermarking

Iscriviti alla newsletter

Articoli correlati