La lotta di Gmail contro le spam sta avendo successo grazie a RETVec

La lotta di Google contro le spam su Gmail sta ottenendo i suoi frutti, e questo grazie al supporto di RETVec. Ma che cos’è?

morghy il robottino giornalista
Morghy, il robottino giornalista

Da mesi Google sta proteggendo le Gmail da tutti questi attacchi spam, potenziando al massimo le sue difese e aggiornando il sistema il più possibile. Ora i nodi vengono al pettine: la sua lotta sta davvero producendo dei risultati.

E questo grazie anche a delle tecnologie efficienti, che rendono Google un sistema sempre più sicuro.

Google protegge Gmail ancora di più sulle spam

Bloccare lo spam via email è una battaglia costante e in continua evoluzione. Per questo, come segnala 9to5google, le ultime disposizioni di sicurezza di Gmail hanno portato un ottimo risultato sul fronte anti-spam, con aumento del 38% del rilevamento grazie a una migliore identificazione del testo. 

Come ci sono riusciti? Grazie a RETVec. Il Resilient & Efficient Text Vectorizer è un software open source di Google Research, che permette di aiutare i modelli a raggiungere prestazioni di classificazione all’avanguardia e ridurre drasticamente i costi computazionali.

Questo perché gli spammer utilizzano spesso omoglifi (caratteri simili a lettere reali), caratteri invisibili, parole chiave in eccesso e altre “manipolazioni di testo“. Tutti atti ad aggirare i modelli di classificazione del testo di Gmail, ovvero i modelli che identificano attacchi di phishing, truffe e altri contenuti dannosi.

Con RETVec, ogni lingua e tutti i caratteri UTF-8 saranno supportati, senza la necessità di pre-elaborazione del testo. Ciò lo rende ideale per casi d’uso su dispositivo, Web e altri casi su larga scala.

I risultati della RETVec sulle spam

Come segnala Google, i modelli addestrati con RETVec possono essere convertiti senza problemi in TFLite per dispositivi mobili e periferici. Mentre per l’applicazione web, si farà uso di un’implementazione del livello TensorflowJS disponibile su Github.

Una soluzione che ha permesso su Gmail di migliorare il tasso di rilevamento dello spam rispetto al valore di base del 38%. Riducendo al contempo sia il tasso di falsi positivi (del 19,4%) che l’utilizzo dell’unità di elaborazione tensor (dell’83%).

E questo perché RETVec ottiene questi miglioramenti sfoggiando un modello di incorporamento di parole molto leggero (~ 200.000 parametri). Esso consente infatti di ridurre le dimensioni del modello Transformer con prestazioni uguali o migliori, avendo la possibilità di dividere il calcolo tra host e TPU in una rete e memoria modo efficiente.

Iscriviti alla newsletter

Non inviamo spam! Leggi la nostra Informativa sulla privacy per avere maggiori informazioni.