L’AI di DeepSeek non è accurata: ha un tasso di errore pari all’83%

DeepSeek vs ChatGPT: il chatbot cinese è davvero un’alternativa valida? NewsGuard svela il tasso di errore e i problemi di accuratezza

Redazione
deepseek

È stata una settimana intensa per il mondo dell’AI dopo l’arrivo di DeepSeek. Il chatbot cinese ha infatti scombussolato i mercati e le classifiche delle app più scaricate in tutto il mondo senza parlare ovviamente dei dubbi sulla privacy che sono stati sollevati primo fra tutti dal Garante della Privacy Italiano.
Ma, classifiche a parte. l’AI si è presentata come un modello in grado di offrire prestazioni pari o superiori a quelle di OpenAI, supportata da Microsoft, a una frazione del costo. Ma questo è vero? A rispondere è un audit di NewsGuard secondo il quale la sua precisione non è davvero così buona come sembra, anzi.

A cosa serve DeepSeek?

DeepSeek è un avanzato motore di ricerca basato sull’intelligenza artificiale, progettato per fornire risultati più precisi e pertinenti rispetto ai tradizionali sistemi di ricerca. Utilizza algoritmi avanzati di comprensione del linguaggio naturale per interpretare meglio le intenzioni degli utenti, offrendo risposte più contestualizzate e approfondite. È particolarmente utile in ambiti come la ricerca accademica, l’analisi dei dati e il supporto decisionale, aiutando gli utenti a trovare informazioni rilevanti in modo più rapido ed efficace.

DeepSeek è davvero meglio di ChatGPT?

Secondo le analisi del NewsGuard il chatbot della startup cinese di intelligenza artificiale DeepSeek ha raggiunto solo il 17% di accuratezza nella trasmissione di notizie e informazioni. Questo l’ha portato a posizionarsi solo al decimo posto, su undici, rispetto ai suoi concorrenti.

Andando a vedere nel dettaglio l’AI ha ripetuto affermazioni false nel 30% dei casi e ha fornito risposte vaghe o non utili nel 53% dei casi in risposta a richieste di notizie, con un tasso di insuccesso dell’83%. Il tasso è decisamente alto specie se paragonato alla media degli altri chatbot tra i quali vi è anche ChatGPT. In media infatti le altre AI hanno un tasso di errore pari al 62%.

Come riportato da Reuters, NewsGuard ha affermato di aver applicato a DeepSeek gli stessi 300 quesiti che aveva utilizzato per valutare le sue controparti occidentali, tra cui 30 quesiti basati su 10 false affermazioni diffuse online.
Tra gli argomenti oggetto delle rivendicazioni figurano l’omicidio, avvenuto il mese scorso, del dirigente della UnitedHealthcare Brian Thompson e l’abbattimento del volo 8243 della Azerbaijan Airlines.

Per saperne di più: Intelligenza artificiale: cos’è e come funziona, tutto sulla AI

Altro dettaglio che non va decisamente sottovalutato, in tre delle dieci domande, DeepSeek ha ribadito la posizione del governo cinese sull’argomento senza che gli venisse chiesto nulla in merito alla Cina.

Iscriviti alla newsletter

Non inviamo spam! Leggi la nostra Informativa sulla privacy per avere maggiori informazioni.