Quando l’AI scrive se stessa: Codex nel ciclo di sviluppo di OpenAI

OpenAI ha portato il concetto di agente di sviluppo software a un livello inedito: Codex, il suo strumento di AI dedicato al coding, è oggi utilizzato in modo esteso dagli stessi ingegneri dell’azienda per costruire, correggere e migliorare Codex. Un processo ricorsivo che segna un cambio di passo nel modo in cui il software viene progettato e mantenuto, trasformando l’intelligenza artificiale da semplice assistente a componente strutturale del lavoro quotidiano.

Codex, da modello a agente di ingegneria software

Durante un’intervista ad ArsTechnica, Alexander Embiricos, product lead del progetto, ha spiegato che “la stragrande maggioranza di Codex è costruita da Codex”. Una dichiarazione che fotografa con chiarezza l’obiettivo di OpenAI: integrare l’agente non solo come strumento operativo, ma come parte attiva del ciclo di sviluppo, sempre sotto supervisione umana.

La versione moderna di Codex è stata presentata come research preview nel maggio 2025. A differenza dei precedenti sistemi di code completion, si tratta di un agente di software engineering basato su cloud, capace di scrivere codice, risolvere problemi complessi e proporre pull request operando in ambienti sandbox collegati direttamente ai repository. Codex può essere utilizzato tramite ChatGPT, una versione a riga di comando e diverse estensioni per ambienti di sviluppo come VS Code, Cursor e Windsurf, con la possibilità di gestire più attività in parallelo.

Il nome Codex richiama una storia più lunga: nel 2021 identificava un modello basato su GPT-3, utilizzato come base tecnologica per GitHub Copilot. Oggi, però, il significato è cambiato. Internamente, racconta Embiricos, Codex viene spesso interpretato come abbreviazione di “code execution”, un riferimento diretto alla capacità dell’agente di comprendere il contesto, eseguire task articolati e accelerare in modo concreto il lavoro degli sviluppatori.

All’interno di OpenAI, la maggior parte degli ingegneri utilizza Codex in modo regolare e lavora sulla stessa versione open source della CLI disponibile anche al pubblico, senza repository interni separati. L’agente non viene impiegato solo per generare codice, ma anche per analizzare feedback, scrivere strumenti di supporto alla ricerca e monitorare i training run. In alcuni casi, Codex è chiamato persino a valutare i commenti degli utenti e a suggerire cosa sviluppare successivamente, ricevendo incarichi attraverso strumenti di project management come Linear, esattamente come un collega umano.

Un ciclo ricorsivo che ridefinisce il lavoro degli sviluppatori

L’uso di Codex all’interno di OpenAI richiama una dinamica ben nota nella storia dell’informatica: strumenti sempre più avanzati vengono utilizzati per costruirne di nuovi. In questo caso, l’agente produce codice sotto supervisione umana, quel codice entra nelle versioni successive e contribuisce a modificare il comportamento dello stesso Codex.

Un esempio concreto è lo sviluppo dell’app Android di Sora, realizzata da quattro ingegneri in 18 giorni e pubblicata in 28 giorni complessivi. Codex ha supportato il team nella pianificazione dell’architettura e nell’implementazione dei componenti, mostrando come l’agente possa affiancare il lavoro umano nelle fasi più operative senza sostituirne il controllo.

Nel confronto con il mercato, OpenAI riconosce una competizione sempre più intensa, anche alla luce di strumenti come Claude Code di Anthropic, lanciato nel febbraio 2025. Allo stesso tempo, rivendica un percorso di sviluppo autonomo. L’adozione di Codex è cresciuta rapidamente: l’utilizzo tra gli sviluppatori esterni è aumentato di venti volte dopo il rilascio della CLI insieme a GPT-5 nell’agosto 2025, con un’ulteriore accelerazione a settembre grazie a GPT-5 Codex, versione specializzata per il coding agentico.

Tra produttività, limiti e prospettive future

Nonostante l’entusiasmo, OpenAI mantiene un approccio prudente. Studi indipendenti mostrano risultati contrastanti sull’impatto dell’AI sulla produttività: una ricerca METR di luglio indica che, su codebase complesse, sviluppatori esperti possono risultare più lenti quando utilizzano strumenti di AI.

Un dato che rafforza la posizione dell’azienda: Codex non è pensato come sostituto, ma come “sviluppatore junior” destinato a crescere nel tempo, con un umano sempre nel ciclo decisionale.

Secondo Ed Bayes, designer del team Codex, l’integrazione con Slack e Linear ha trasformato l’agente in un vero “compagno di squadra”, a cui è possibile assegnare ticket e dal quale ricevere pull request da discutere nello stesso flusso di lavoro. Una modalità che avvicina l’AI alle dinamiche reali dei team di sviluppo.

Quando l’AI scrive se stessa: il caso di Codex nel ciclo di sviluppo di OpenAI

Codex, da modello a agente di ingegneria software

Un ciclo ricorsivo che ridefinisce il lavoro degli sviluppatori

Tra produttività, limiti e prospettive future

Iscriviti alla newsletter

Codex, da modello a agente di ingegneria software

Un ciclo ricorsivo che ridefinisce il lavoro degli sviluppatori

Tra produttività, limiti e prospettive future

Iscriviti alla newsletter

Articoli correlati