Anthropic lancia Claude Opus 4.5, la nuova iterazione del suo modello di punta, progettata per potenziare l’affidabilità in compiti tecnici, gestire sequenze operative più lunghe e aumentare la resistenza alle manipolazioni.
Prestazioni tecniche e capacità di problem solving
Claude Opus 4.5 si distingue innanzitutto per i miglioramenti tecnici introdotti rispetto alle versioni precedenti. Secondo i dati forniti da Anthropic, il modello avrebbe superato i candidati umani in un test tecnico a tempo, utilizzato dall’azienda per valutare ingegneri software. Pur rappresentando un risultato di rilievo, la comparazione diretta è resa complessa dall’assenza di dettagli sul campione testato e sulle condizioni specifiche della prova, elementi cruciali per contestualizzare i dati.
Un aspetto particolarmente interessante riguarda la creatività del modello nel seguire le regole. In un esperimento su compiti tipici degli agenti virtuali, il sistema ha identificato una soluzione alternativa per modificare un biglietto aereo in classe basic economy, anticipando un cambio di cabina consentito prima di procedere alla modifica del volo.
Sul fronte della sicurezza, Anthropic evidenzia come Opus 4.5 sia più resistente ai tentativi avanzati di prompt injection, quei messaggi progettati per aggirare le istruzioni del modello. A supporto del lancio, l’azienda propone strumenti aggiornati per sviluppatori e utenti: tra questi la possibilità di regolare l’“effort”, parametro che definisce il livello di concentrazione e riflessione del modello su un compito, ottimizzando performance e costi.
Applicazioni aggiornate e strumenti per gli utenti
Claude Opus 4.5 introduce anche novità significative nelle applicazioni pratiche. Claude Code beneficia di strumenti volti a rendere più trasparente e sicura l’esecuzione delle modifiche ai progetti software, attraverso la generazione automatica di file di piano e una fase preliminare di domande chiarificatrici. La versione desktop permette di gestire più sessioni contemporaneamente, agevolando chi lavora su problemi complessi con task paralleli.
Parallelamente, l’integrazione con strumenti quotidiani come Chrome ed Excel, già annunciata nei mesi scorsi, viene estesa a più piani di abbonamento, ampliando l’accesso alle funzionalità più avanzate e migliorando l’esperienza d’uso.
Nel complesso, Claude Opus 4.5 consolida la strategia di Anthropic: un modello più stabile, più sicuro e più performante nelle attività operative, in grado di gestire compiti complessi e prolungati senza compromettere l’affidabilità. L’evoluzione è chiara, anche se non rivoluzionaria, segnando un passo avanti significativo nella maturazione dei modelli AI professionali.