OpenAI ha annunciato l’avvio di una fase di anteprima limitata per la nuova famiglia di modelli GPT-5.6, composta da Sol, Terra e Luna. La società descrive Sol come il proprio modello di punta, mentre Terra punta a un equilibrio tra prestazioni e costi e Luna si propone come l’opzione più economica e veloce. L’azienda ha inoltre sottolineato di aver introdotto il sistema di sicurezza più avanzato mai implementato sui propri modelli, con particolare attenzione alle richieste legate alla cybersicurezza e agli utilizzi potenzialmente dannosi.
Le novità della famiglia GPT-5.6
Secondo OpenAI, GPT-5.6 Sol rappresenta il modello più potente mai sviluppato dall’azienda. Tra le principali innovazioni figura una nuova modalità di ragionamento avanzato, progettata per consentire al modello di dedicare più tempo all’analisi dei problemi complessi. A questa si aggiunge una funzione denominata Ultra Mode, che sfrutta subagenti per affrontare attività articolate e accelerare l’esecuzione dei compiti più impegnativi.
Sul fronte delle prestazioni, Sol ha ottenuto risultati di rilievo nei benchmark dedicati alla programmazione, alla biologia e alla cybersicurezza. Nei flussi di lavoro di coding ha raggiunto nuovi livelli di riferimento nel test Terminal-Bench 2.1, mentre nelle analisi genomiche e biologiche di lungo periodo ha superato GPT-5.5 utilizzando un numero inferiore di token.
Anche in ambito sicurezza informatica il modello mostra progressi significativi. OpenAI evidenzia come GPT-5.6 Sol migliori l’efficienza nelle attività di ricerca delle vulnerabilità e nei test di sicurezza, pur mantenendo limiti specifici per evitare utilizzi offensivi.
Maggiori capacità cyber, ma con controlli più rigidi
L’incremento delle capacità operative è stato accompagnato da una revisione profonda delle misure di protezione. OpenAI afferma di aver progettato un sistema multilivello di salvaguardie, adattato alle caratteristiche di ciascun modello della famiglia GPT-5.6. L’obiettivo dichiarato è favorire attività legittime come revisione del codice, ricerca di vulnerabilità, sviluppo di patch e formazione sulla sicurezza, limitando invece gli utilizzi offensivi proibiti.
La società precisa che GPT-5.6 Sol non supera la soglia definita “Cyber Critical” all’interno del proprio framework di valutazione. Nei test effettuati su browser come Chromium e Firefox, il modello è stato in grado di individuare bug e componenti utili per un exploit, ma non ha prodotto autonomamente un attacco completo funzionante nelle condizioni esaminate.
Tra le nuove misure di sicurezza figurano rifiuti automatici per richieste cyber vietate, controlli in tempo reale durante la generazione delle risposte e sistemi di revisione aggiuntivi per i casi considerati più rischiosi. In alcune circostanze le risposte possono essere sospese per consentire una verifica supplementare prima della consegna all’utente.
Red teaming automatizzato e oltre 700 mila ore GPU dedicate alla sicurezza
Per rafforzare ulteriormente la robustezza dei modelli, OpenAI ha investito in attività di red teaming automatizzato, utilizzando i propri sistemi di intelligenza artificiale per individuare vulnerabilità e tentativi di aggiramento delle protezioni.
L’azienda dichiara di aver impiegato oltre 700.000 ore equivalenti di GPU NVIDIA A100 per individuare jailbreak universali e altre tecniche di attacco applicabili a un’ampia varietà di contesti. Questo approccio avrebbe consentito di esplorare molti più scenari rispetto ai tradizionali test manuali e di accelerare la correzione delle debolezze individuate.
Parallelamente, OpenAI ha coinvolto esperti esterni per attività di red teaming umano, che continueranno durante l’intera fase di anteprima. L’obiettivo è verificare il comportamento dei modelli anche di fronte a tentativi creativi e imprevedibili di abuso.
Disponibilità iniziale e nuovo sistema di denominazione
La distribuzione di GPT-5.6 avverrà inizialmente attraverso API e Codex e sarà limitata a un gruppo selezionato di partner e organizzazioni considerate affidabili. OpenAI prevede tuttavia di estendere la disponibilità a un pubblico più ampio nelle prossime settimane, includendo anche gli utenti di ChatGPT.
Con GPT-5.6 debutta inoltre un nuovo schema di denominazione: il numero identifica la generazione tecnologica, mentre Sol, Terra e Luna rappresentano livelli di capacità distinti che potranno evolversi indipendentemente nel tempo.
Prezzi e arrivo su Cerebras
OpenAI ha comunicato anche i prezzi della nuova gamma. Il modello Sol costerà 5 dollari per milione di token in input e 30 dollari in output. Terra sarà disponibile a 2,50 dollari in input e 15 dollari in output, mentre Luna avrà un costo di 1 dollaro in input e 6 dollari in output. La società introduce inoltre nuove funzionalità di caching per rendere più prevedibili i costi di utilizzo.
OpenAI ha infine annunciato che GPT-5.6 Sol sarà disponibile anche sulla piattaforma Cerebras a partire da luglio, con velocità dichiarate fino a 750 token al secondo. In una prima fase l’accesso sarà limitato a una selezione di clienti, mentre la capacità verrà progressivamente ampliata.