Anthropic alza il livello di Claude con Fable 5 e Mythos 5

Prestazioni record nei benchmark e nuove misure di sicurezza per evitare utilizzi pericolosi dei modelli

Redazione

Claude cambia marcia con il lancio di due nuovi modelli di intelligenza artificiale destinati a ridefinire gli standard del settore. La società ha annunciato l’arrivo di Claude Fable 5 e Claude Mythos 5, sistemi definiti come i più avanzati mai resi disponibili dall’azienda, con capacità che spaziano dall’ingegneria software alla ricerca scientifica, passando per la cybersecurity e la biologia molecolare.

Secondo quanto comunicato, i nuovi modelli mostrano prestazioni superiori rispetto alle generazioni precedenti, ma l’aumento della potenza ha portato anche a nuove misure di sicurezza, soprattutto per evitare usi impropri in ambiti sensibili come attacchi informatici o ricerca biologica avanzata.

Claude Fable 5 punta tutto su programmazione e analisi avanzata

Il nuovo Claude Fable 5 è presentato come un modello “Mythos-class” adattato all’utilizzo generale. L’azienda sostiene che si tratti del sistema più performante mai distribuito pubblicamente, con risultati ai vertici nei benchmark dedicati a programmazione, analisi documentale, ricerca scientifica e visione artificiale.

Tra gli esempi riportati spicca il caso di Stripe, che avrebbe utilizzato il modello per comprimere “mesi di lavoro ingegneristico in pochi giorni”. In un enorme codice Ruby da 50 milioni di righe, Fable 5 sarebbe riuscito a completare una migrazione software in un solo giorno, operazione che manualmente avrebbe richiesto oltre due mesi di lavoro a un intero team.

Anche sul fronte della produttività analitica il modello mostra miglioramenti significativi. Nei benchmark finanziari di Hebbia, Fable 5 avrebbe ottenuto il punteggio più alto tra i modelli AI testati, distinguendosi per interpretazione di documenti, grafici e tabelle.

Visione artificiale e memoria di lungo periodo

Uno dei punti più sorprendenti riguarda le capacità visive del nuovo modello. Claude Fable 5 viene descritto come il nuovo stato dell’arte nelle attività che combinano immagini e ragionamento.

Il sistema sarebbe in grado di estrarre dati precisi da figure scientifiche molto complesse e persino ricostruire il codice sorgente di una web app partendo solo da screenshot. L’azienda ha mostrato anche un test in cui il modello completa il videogioco Pokémon FireRed usando esclusivamente schermate del gioco, senza mappe o strumenti di supporto.

Sul fronte della memoria, Fable 5 riesce a mantenere il contesto anche su task lunghi milioni di token. In un esperimento con il gioco Slay the Spire, l’accesso a una memoria persistente avrebbe migliorato le prestazioni tre volte più rispetto al modello Opus 4.8.

Mythos 5 dedicato a cybersecurity e ricerca biologica

Accanto a Fable 5 arriva anche Claude Mythos 5, una versione con meno limitazioni destinata inizialmente a partner selezionati, soprattutto nel settore della sicurezza informatica e delle infrastrutture critiche.

Il modello sarà distribuito attraverso il programma Project Glasswing, sviluppato in collaborazione con il governo statunitense. Secondo l’azienda, Mythos 5 possiede “le capacità di cybersecurity più forti al mondo”.

In campo biologico, Mythos 5 avrebbe accelerato alcuni processi di progettazione farmaceutica fino a dieci volte. Gli esperti interni avrebbero verificato che il modello riesce a svolgere autonomamente compiti normalmente affidati a ricercatori umani, come la scelta dei siti di legame proteico o l’utilizzo di strumenti bioinformatici.

Il sistema avrebbe inoltre prodotto nuove ipotesi scientifiche nel campo della biologia molecolare, giudicate preferibili rispetto a quelle generate dai modelli Opus in circa l’80% dei confronti effettuati dagli scienziati interni.

Le nuove protezioni contro gli abusi

L’azienda riconosce apertamente che modelli di questo livello introducono rischi importanti. Per questo Fable 5 utilizza nuovi classificatori di sicurezza che analizzano le richieste degli utenti e intervengono quando rilevano potenziali utilizzi pericolosi.

Nel caso di richieste relative a cybersecurity offensiva, biologia, chimica o tentativi di “distillazione” del modello, il sistema devia automaticamente verso Claude Opus 4.8, considerato meno rischioso.

Secondo i dati forniti, oltre il 95% delle sessioni non attiverebbe alcun blocco, ma l’azienda ammette che le protezioni possono ancora generare falsi positivi. Per testare la resistenza ai tentativi di aggiramento, sono state effettuate oltre 1.000 ore di test di sicurezza senza individuare jailbreak universali efficaci.

Prezzi, disponibilità e nuove regole sui dati

Claude Fable 5 è disponibile da subito, mentre Mythos 5 resterà limitato ai partner del programma Glasswing e, successivamente, a un ristretto gruppo di ricercatori biologici.

Entrambi i modelli vengono offerti a 10 dollari per milione di token in input e 50 dollari per milione di token in output, un prezzo che l’azienda definisce inferiore a metà rispetto a Mythos Preview.

Per i clienti business arriva anche una nuova politica di conservazione dati: tutti i modelli Mythos-class richiederanno una retention di 30 giorni per il traffico generato. L’azienda assicura che i dati non saranno utilizzati per addestrare nuovi modelli, ma solo per finalità legate alla sicurezza e all’individuazione di nuovi attacchi o jailbreak.

Iscriviti alla newsletter

Non inviamo spam! Leggi la nostra Informativa sulla privacy per avere maggiori informazioni.