Intelligenza artificiale, certe repliche sono troppo simili agli originali

Il rischio di plagio è sempre dietro l’angolo, e per le AI può diventare un grosso problema se chi le programma non mette dei paletti all’uso di contenuti originali adottati come base per la rielaborazione.

La questione è stata infatti al centro di un recente esperimento, che ha portato alla luce alcune problematiche ancora in essere per le intelligenze artificiali: il creare repliche fin troppo simili a quelle originali.

Replica, troppo replica: lo studio di Marcus e Southern sulle AI

I risultati fanno parte di una ricerca di due settimane condotta dal ricercatore di intelligenza artificiale Gary Marcus e dall’artista digitale Reid Southen, che hanno scoperto che i modelli di IA possono produrre “repliche quasi identiche di personaggi protetti da marchio“ con un semplice prompt di testo.

Marcus e Southen hanno messo alla prova due modelli di intelligenza artificiale visiva, Midjourney e Dall-E 3, scoprendo che entrambi sono in grado di riprodurre immagini quasi identiche da film e videogiochi anche quando i modelli ricevono prompt brevi e indiretti, secondo un rapporto pubblicato su IEEE Spectrum.

Anche in altri ambiti il problema è emerso in maniera evidente. Come riporta Business Insider, quando i ricercatori hanno inserito il prompt “videogioco italiano” nel modello DALL-E 3 di OpenAI, il modello ha restituito immagini riconoscibili di Mario, iconico personaggio della famosa franchise Nintendo, mentre la frase “spugna animata” ha restituito immagini chiare dell’eroe di Spongebob Squarepants.

In un’altra occasione, i ricercatori hanno inserito il prompt “cartone animato popolare degli anni ’90 con pelle gialla” in Midjourney, il quale ha prodotto immagini riconoscibili di personaggi de I Simpson. Allo stesso tempo, il prompt “armatura nera con spada luminosa” ha generato una somiglianza ravvicinata con personaggi della franchise di Star Wars.

La lunga bagarre tra intelligenze artificiali ed editoria

Lo studio arriva in un momento di crescente preoccupazione per la capacità dei modelli generativi di IA di commettere plagio. Ad esempio, una recente causa legale intentata dal New York Times contro OpenAI sosteneva che il GPT-4 aveva riprodotto blocchi di articoli del New York Times quasi parola per parola.

Il problema è che i modelli generativi sono ancora “scatole nere” in cui la relazione tra gli input e gli output non è completamente chiara per gli utenti finali. Pertanto, secondo il rapporto degli autori, è difficile prevedere quando un modello genererà una risposta plagiatrice.

L’implicazione per l’utente finale è che, se non riconoscono immediatamente un’immagine protetta da marchio nei risultati di un modello di IA, non hanno un altro modo di verificare la violazione del copyright, sostengono gli autori. D’altro canto, quando qualcuno trova un’immagine tramite una ricerca su Google, ha più risorse per determinare la fonte e se è accettabile utilizzarla.

Per questo, gli autori suggeriscono che i modelli di IA potrebbero semplicemente escludere opere coperte da copyright dai loro dati di addestramento, filtrare le query problematiche o elencare semplicemente le fonti utilizzate per generare le immagini.

Inoltre, sarebbe meglio se i modelli di IA utilizzino solo dati di addestramento regolarmente licenziati finché non si trova una soluzione migliore per segnalare l’origine delle immagini e filtrare le violazioni del copyright.

Le AI diventano sempre più efficienti nel creare repliche. Forse fin troppo

Replica, troppo replica: lo studio di Marcus e Southern sulle AI

La lunga bagarre tra intelligenze artificiali ed editoria

Iscriviti alla newsletter

Replica, troppo replica: lo studio di Marcus e Southern sulle AI

La lunga bagarre tra intelligenze artificiali ed editoria

Iscriviti alla newsletter

Articoli correlati