AI agent fuori controllo? Il nuovo allarme sulla sicurezza dei modelli aperti

Le ricerche mostrano come i sistemi possano essere modificati facilmente, sollevando dubbi sulla loro reale affidabilità

Redazione
Ai agent sicurezza nel settore cripto con avviso sui rischi digitali

Le recenti analisi sullo sviluppo degli AI agent stanno riaccendendo il dibattito sulla loro sicurezza e sul modo in cui dovrebbero essere regolati. Diversi ricercatori invitano a considerarli come sistemi intrinsecamente non affidabili, soprattutto in un contesto in cui la loro adozione cresce rapidamente e la loro autonomia operativa aumenta.

AI agent come sistemi non affidabili

L’idea centrale emersa dagli studi è che gli AI agent non possano essere trattati come strumenti pienamente sicuri per impostazione predefinita. Alcuni ricercatori e specialisti del settore, tra cui figure legate a grandi realtà tecnologiche, sottolineano la necessità di adottare un approccio di “zero trust”, in cui nessun agente viene considerato affidabile a priori.

Questa impostazione diventa cruciale soprattutto quando gli agenti operano in contesti sensibili, come quelli finanziari o infrastrutturali, dove anche un singolo errore o comportamento imprevisto può generare conseguenze significative.

Espansione degli AI agent e nuovi scenari d’uso

L’utilizzo degli AI agent sta crescendo in modo rapido e trasversale, con una diffusione sempre più ampia anche nei sistemi decentralizzati e nelle infrastrutture digitali complesse. In particolare, l’ecosistema delle criptovalute rappresenta uno degli ambiti in cui questi strumenti vengono integrati con maggiore velocità.

Gli agenti vengono impiegati per automatizzare operazioni, gestire flussi di dati e supportare decisioni in tempo reale. Tuttavia, proprio questa crescente autonomia apre interrogativi sulla capacità di controllo da parte degli sviluppatori e degli utenti finali.

Il punto critico è che, man mano che gli AI agent diventano più sofisticati, aumenta anche la superficie d’attacco potenziale, rendendo più complessa la gestione della sicurezza complessiva dei sistemi.

Guardrail rimovibili e rischi nei modelli open-source

Una delle principali preoccupazioni riguarda i modelli open-source. Secondo test condotti congiuntamente da Financial Times e ricercatori specializzati in sicurezza dell’IA, le protezioni integrate nei modelli possono essere rimosse in pochi minuti utilizzando strumenti pubblicamente disponibili.

In alcuni casi, sistemi sviluppati da grandi aziende tecnologiche come Meta e Google sono stati modificati in meno di dieci minuti, senza bisogno di hardware specializzato. Una volta alterati, i modelli sono stati in grado di rispondere anche a richieste inizialmente bloccate, incluse quelle relative a malware o sostanze pericolose.

Questo evidenzia un punto critico: i guardrail implementati in fase di sviluppo non sempre resistono alla distribuzione e alla modifica dei modelli, soprattutto quando questi vengono rilasciati come open-source.

Limiti della governance e sfide regolatorie

Le autorità di regolamentazione, tra cui Unione Europea, Regno Unito e Stati Uniti, stanno sviluppando nuovi framework per disciplinare i sistemi di intelligenza artificiale avanzata. Tuttavia, gli esperti evidenziano che questi strumenti normativi potrebbero non essere sufficienti a gestire la natura dinamica degli AI open-source.

Il problema principale è che le regole attuali tendono a concentrarsi sulla fase di sviluppo dei modelli, mentre le criticità emergono soprattutto dopo il rilascio, quando i sistemi possono essere copiati, modificati e redistribuiti liberamente.

In questo contesto, il controllo diventa più difficile e frammentato, rendendo la governance tradizionale meno efficace.

Il controllo si sposta dopo il rilascio

Secondo diversi esperti di sicurezza e infrastrutture blockchain, il punto decisivo non è più solo la creazione del modello, ma la sua distribuzione e il suo utilizzo reale. Una volta che i pesi dei modelli vengono diffusi online, diventa quasi impossibile impedirne la modifica o la replicazione.

Per questo motivo, il focus si sta spostando verso la gestione delle piattaforme di hosting, dei canali di distribuzione e delle applicazioni commerciali.

Gli analisti sottolineano inoltre che le misure di sicurezza integrate possono ridurre gli abusi da parte di utenti non esperti, ma non rappresentano una barriera solida contro attori avanzati o intenzionati a sfruttare il sistema.

In modo simile a quanto già accaduto con software open-source e reti decentralizzate, la diffusione del codice rende il contenimento dei rischi una sfida strutturale più che tecnica.

Fonte: Cointelegraph

Iscriviti alla newsletter

Non inviamo spam! Leggi la nostra Informativa sulla privacy per avere maggiori informazioni.