OpenAI compie un passo importante nel mondo della programmazione assistita dall’intelligenza artificiale, con il lancio di una nuova app per macOS dedicata al suo strumento Codex. La novità arriva dopo l’uscita di GPT-5.2-Codex, il modello di codifica più potente sviluppato dall’azienda, e punta a trasformare radicalmente il modo in cui gli sviluppatori collaborano con gli agenti AI.
Agentic software development e nuove interfacce
Negli ultimi anni, la programmazione assistita da AI ha visto una trasformazione profonda: gran parte del lavoro più ripetitivo viene ormai gestito da agenti e sub-agenti autonomi. Applicazioni come Claude Code e Cowork hanno introdotto un concetto noto come agentic software development, in cui gli agenti possono operare in maniera indipendente su compiti di codifica complessi.
Stando a Tech Crunch, la nuova app macOS di Codex integra molte di queste pratiche. Grazie a un’interfaccia che supporta più agenti in parallelo e l’integrazione di competenze diversificate, gli sviluppatori possono sfruttare flussi di lavoro all’avanguardia. Nell’app, gli agenti sono gestiti per singolo progetto e possono sfruttare i worktree, riducendo così i conflitti tra modifiche. La versione macOS introduce anche le Skills, estensioni organizzate come cartelle che contengono istruzioni e risorse, e le Automations, flussi automatici configurabili dall’utente secondo regole e pianificazioni prestabilite, pienamente compatibili con le Skills.
L’aggiornamento punta inoltre a rendere più accessibile la potenza di GPT-5.2-Codex, offrendo la possibilità di affrontare progetti sofisticati con un’interazione più flessibile rispetto agli strumenti precedenti. Come spiegato dal CEO Sam Altman durante una recente call: “Se vuoi lavorare su qualcosa di complesso, 5.2 è il modello più potente di gran lunga. Ma è stato più difficile da usare; mettere questa capacità in un’interfaccia più flessibile farà la differenza.”
Prestazioni, automazioni e personalizzazione
Benchmarks recenti offrono un quadro articolato delle prestazioni di GPT-5.2. Su TerminalBench, che misura l’abilità nel gestire attività da riga di comando, il modello si conferma al top, sebbene Gemini 3 e Claude Opus registrino risultati simili, entro il margine di errore. Su SWE-bench, test focalizzato sulla capacità di risolvere bug reali, non emerge un vantaggio netto, sottolineando come le applicazioni agentiche siano difficili da valutare con parametri tradizionali.
La nuova app Codex introduce inoltre funzionalità pensate per aumentare la produttività: automazioni programmate in background con risultati gestibili in coda, e la possibilità di selezionare personalità differenti per l’agente, da pragmatico a empatico, in base allo stile di lavoro dell’utente. Secondo Altman, il vero punto di forza resta la velocità di sviluppo: “puoi partire da un foglio bianco e creare un software sofisticato in poche ore. La velocità con cui posso digitare nuove idee è il limite di ciò che può essere costruito.”
A partire da oggi, OpenAI ha annunciato il raddoppio dei rate limit di Codex per i piani Plus, Pro, Business, Enterprise ed Edu. Inoltre, Codex viene reso disponibile anche agli utenti ChatGPT Free e Go “per un periodo limitato”, senza però specificare nel dettaglio i limiti applicati a questi livelli.