Claude Sonnet 5 alza il livello dell’intelligenza artificiale agentica

Claude Sonnet 5 debutta ufficialmente: più autonomo, più sicuro e con prestazioni vicine a Opus a costi ridotti

Redazione

Anthropic amplia la propria famiglia di modelli di intelligenza artificiale con Claude Sonnet 5, una nuova versione progettata per offrire capacità agentiche più avanzate senza rinunciare a un prezzo competitivo. Il modello punta a ridurre il divario con la serie Opus, migliorando ragionamento, utilizzo degli strumenti, programmazione e attività di knowledge work, oltre a introdurre ulteriori progressi sul fronte della sicurezza.

Un modello più autonomo e vicino alle prestazioni di Opus

Secondo Anthropic, Claude Sonnet 5 è il modello Sonnet più agentico mai realizzato. È stato sviluppato per pianificare attività complesse, utilizzare strumenti come browser e terminali e operare in autonomia su compiti che, fino a pochi mesi fa, richiedevano modelli di fascia superiore e decisamente più costosi.

L’azienda ricorda che le precedenti versioni della famiglia Sonnet, come Claude Sonnet 3.5, 3.6 e 3.7, hanno contribuito a inaugurare l’era dell’IA agentica grazie alle loro capacità di programmazione e utilizzo degli strumenti. Negli ultimi mesi, tuttavia, i maggiori progressi erano stati registrati dalla serie Opus.

Con Sonnet 5, il divario si riduce sensibilmente. Le prestazioni vengono descritte come vicine a quelle di Opus 4.8, pur mantenendo costi inferiori. Rispetto a Sonnet 4.6, il nuovo modello migliora nelle principali aree considerate fondamentali per un assistente AI avanzato: ragionamento, coding, uso degli strumenti e lavoro sulla conoscenza.

I test effettuati da Anthropic mostrano inoltre che Sonnet 5 offre un rapporto costo-prestazioni più favorevole. Ai livelli medi di elaborazione risulta significativamente più efficiente, mentre con livelli di impegno più elevati può raggiungere, in alcuni scenari, prestazioni paragonabili a quelle di Opus 4.8.

Disponibilità immediata e prezzi promozionali

Claude Sonnet 5 è disponibile da subito su tutti i piani di utilizzo. Diventa il modello predefinito per gli utenti Free e Pro ed è accessibile anche ai clienti Max, Team ed Enterprise.

Il modello arriva inoltre su Claude Code e sulla Claude Platform, dove gli sviluppatori possono utilizzarlo tramite l’API claude-sonnet-5.

Per il lancio è previsto un prezzo promozionale valido fino al 31 agosto 2026: 2 dollari per milione di token in input e 10 dollari per milione di token in output. Terminata la promozione, il costo salirà rispettivamente a 3 dollari e 15 dollari per milione di token.

Anthropic ha inoltre annunciato un incremento dei limiti di utilizzo su Chat, Cowork, Claude Code e Claude Platform per supportare il maggiore consumo di token richiesto dai livelli di elaborazione più elevati, lasciando agli utenti la possibilità di scegliere il compromesso più adatto tra costi e prestazioni.

Sicurezza migliorata e minori comportamenti indesiderati

Le valutazioni di sicurezza condotte prima del rilascio evidenziano un miglioramento complessivo rispetto a Sonnet 4.6. Il modello è più efficace nel rifiutare richieste malevole, nel resistere ai tentativi di prompt injection e presenta una riduzione dei fenomeni di allucinazione e di compiacenza verso l’utente.

Anche gli audit automatici sul comportamento mostrano un numero inferiore di comportamenti indesiderati rispetto al predecessore, sebbene Sonnet 5 rimanga leggermente meno sicuro dei modelli più avanzati Opus 4.8 e Claude Mythos Preview sotto questo specifico aspetto.

Per quanto riguarda la cybersicurezza, Anthropic sottolinea di non aver addestrato deliberatamente Sonnet 5 per attività offensive. Il modello è in grado di svolgere operazioni informatiche ordinarie e non dannose, ma ottiene risultati nettamente inferiori rispetto ai modelli Opus nelle valutazioni dedicate allo sviluppo di exploit software.

Protezioni cyber attive fin dal lancio

Uno dei test citati riguarda la capacità di sviluppare exploit per vulnerabilità di Firefox 147, realizzato in collaborazione con Mozilla. In queste prove Claude Sonnet 5 non è mai riuscito a produrre un exploit completamente funzionante, mostrando soltanto un lieve incremento nei casi di successo parziale rispetto a Sonnet 4.6. Secondo Anthropic, questo miglioramento deriva dall’aumento delle capacità generali del modello e non da un addestramento specifico in ambito cyber.

Proprio perché Sonnet 5 risulta leggermente più potente del predecessore in questi scenari, il modello viene distribuito con protezioni di cybersicurezza abilitate di default. I sistemi di salvaguardia rilevano e bloccano in tempo reale gli utilizzi ritenuti pericolosi e sono gli stessi adottati per Claude Opus 4.7 e 4.8.

Anthropic precisa infine che tali protezioni risultano comunque meno restrittive rispetto a quelle introdotte con Fable 5, poiché la valutazione complessiva del rischio informatico associato a Sonnet 5 è stata considerata relativamente contenuta.

Iscriviti alla newsletter

Non inviamo spam! Leggi la nostra Informativa sulla privacy per avere maggiori informazioni.