Claude Opus 4 e Sonnet 4, i nuovi modelli AI di Anthropic

Anthropic ha svelato due nuovi modelli linguistici che promettono di cambiare il panorama dell’AI per sviluppatori e aziende: Claude Opus 4 e Claude Sonnet 4. Entrambi rappresentano la quarta generazione della linea Claude e introducono miglioramenti sostanziali in termini di prestazioni nel coding, ragionamento complesso e interazione con strumenti esterni. Disponibili su Anthropic API, Amazon Bedrock e Google Cloud Vertex AI, i modelli mantengono gli stessi prezzi delle versioni precedenti, ma alzano decisamente l’asticella delle capacità.

Claude Opus 4 e Sonnet 4: prestazioni da primato nel coding

La quarta generazione dei modelli Claude segna un cambio di marcia per l’intelligenza artificiale applicata allo sviluppo software.

Claude Opus 4, in particolare, si posiziona al vertice della categoria: 72,5% su SWE-bench Verified e 43,2% su Terminal-bench, due benchmark che simulano sfide reali di programmazione. Il modello riesce a operare in autonomia su compiti prolungati, mantenendo coerenza e precisione anche su progetti articolati e multi-file. Partner tecnologici come Replit, Cursor, Block e Cognition ne hanno validato l’efficacia in ambienti produttivi, sottolineando la capacità di risolvere bug, correggere codice in modo autonomo e affrontare problemi complessi dove altri modelli falliscono.

Anche Claude Sonnet 4 si distingue, con un 72,7% su SWE-bench e significativi progressi nella comprensione delle istruzioni e nella risoluzione di problemi. È stato integrato nel nuovo agente di Codice di GitHub Copilot e ha ottenuto riscontri positivi da Sourcegraph, iGent e Augment Code per l’efficacia nel navigare codebase e completare task autonomi multifunzione.

Ragionamento esteso e memoria persistente: verso agenti cognitivi

La novità più significativa è l’introduzione dell’extended thinking: i modelli possono ora alternare momenti di riflessione interna con l’utilizzo di strumenti esterni, come ricerche web o accesso a file. Questo approccio migliora la qualità e la pertinenza delle risposte nei compiti più lunghi e complessi.

Quando autorizzati, i modelli – in particolare Opus 4 – sono capaci di creare e aggiornare file di memoria, conservando informazioni chiave e garantendo coerenza nel tempo. Claude 4 riduce del 65% i comportamenti scorciatoia rispetto a Sonnet 3.7, una svolta nei compiti dove serve completezza più che velocità.

Inoltre, è stato introdotto un sistema di sintesi del pensiero, attivo nel 5% delle interazioni più lunghe, e una modalità Developer che consente di esplorare l’intero flusso cognitivo per chi si occupa di prompt engineering avanzato. Una vera e propria architettura cognitiva, modellata per l’agire intelligente.

Claude Code e nuove API: più potere agli sviluppatori

A supporto dei nuovi modelli, Anthropic introduce Claude Code, una suite pensata per gli sviluppatori che vogliono sfruttare Claude direttamente nel terminale, negli IDE (come VS Code e JetBrains) e tramite SDK in background. Claude Code supporta GitHub Actions e permette la costruzione di agenti AI personalizzati grazie a un SDK estendibile. È inoltre possibile installare un’integrazione beta su GitHub con il comando /install-github-app.

Sul fronte delle API, le novità sono quattro: esecuzione del codice, connettore MCP, gestione file e caching dei prompt fino a un’ora. Queste funzionalità migliorano significativamente la continuità e la coerenza del comportamento degli agenti costruiti con Claude, rendendoli più efficaci in scenari reali di lavoro.

Claude Opus 4 e Sonnet 4: prestazioni da primato nel coding

Ragionamento esteso e memoria persistente: verso agenti cognitivi

Claude Code e nuove API: più potere agli sviluppatori

Iscriviti alla newsletter

Articoli correlati