OpenAI ha annunciato novità importanti per gli sviluppatori, puntando a rendere l’agente di programmazione Codex più potente e accessibile.
Codex ora connesso a internet e accessibile su ChatGPT Plus
L’agente è ora disponibile anche per gli utenti ChatGPT Plus, con limiti generosi e, soprattutto, la possibilità di connettersi a internet. La funzione, disattivata di default, consente l’installazione di dipendenze, l’aggiornamento di pacchetti e l’esecuzione di test online, il tutto con controllo selettivo sui domini.
Oltre alla connessione, Codex è ora in grado di modificare pull request esistenti e ricevere comandi vocali, per un’interazione più naturale. Le funzionalità sono disponibili per gli utenti Plus, Pro e Teams, e presto anche per le aziende con piano Enterprise.
L’aggiornamento introduce inoltre importanti migliorie tecniche. Tra queste: supporto ai file binari, messaggi di errore più chiari nei setup, e un aumento del limite di confronto tra task da 1 a 5 MB. Inoltre, i tempi di esecuzione degli script sono raddoppiati a 10 minuti.
Sul fronte GitHub, risolti problemi di notifica e riattivate le Live Activities su iOS. È stata anche rimossa l’autenticazione a due fattori per l’accesso via SSO o social login, semplificando il lavoro dei team.
Un nuovo Agents SDK e un modello vocale più avanzato
Inoltre, OpenAI ha rilasciato una nuova versione dell’Agents SDK, ora anche in TypeScript. Il pacchetto include strumenti avanzati per creare agenti vocali, tra cui il controllo manuale (human-in-the-loop), la sospensione di strumenti e l’approvazione di azioni prima della ripresa.
Anche il modello speech-to-speech è stato aggiornato: ora capisce meglio le istruzioni, gestisce meglio le interruzioni e permette di regolare la velocità del parlato. È accessibile tramite le API Realtime (gpt-4o-realtime-preview-2025-06-03) e Chat Completions (gpt-4o-audio-preview-2025-06-03).
Per ultimo, la dashboard Traces è stata potenziata e ora supporta pienamente le sessioni vocali in tempo reale, offrendo una visione completa delle interazioni, comprese le chiamate agli strumenti e i flussi audio.