OpenAI fa un salto avanti decisivo nel mondo dell’intelligenza artificiale con il lancio dell’agente ChatGPT (ChatGPT agent), un assistente digitale capace di fare molto più che rispondere a domande: ora può completare autonomamente una vasta gamma di compiti informatici, dal gestire il calendario alla creazione di presentazioni, fino all’esecuzione di codice. Questo nuovo strumento rappresenta un passo importante verso un’AI che agisce concretamente al posto degli utenti, portando a termine operazioni complesse con un semplice comando in linguaggio naturale.
Agente ChatGPT, l’assistente AI che fa di più
Il nuovo agente ChatGPT è molto più di un semplice chatbot. Combina abilità già viste in strumenti precedenti, come Operator, che poteva navigare da solo su siti web, e Deep Research, che sintetizzava informazioni da decine di fonti in report efficaci. Ora, però, tutto questo si unisce in un agente unico che può lavorare per te, capendo richieste in linguaggio naturale e portandole a termine senza bisogno di indicazioni complicate.
Gli utenti abbonati ai piani Pro, Plus e Team possono già attivare questa modalità scegliendo “agent mode” nel menu di ChatGPT, e da lì iniziare a delegare compiti più articolati. Non si tratta più solo di farsi aiutare a scrivere o cercare, ma di lasciare che l’AI gestisca autonomamente una serie di attività digitali, come aggiornare il calendario, pianificare eventi, o addirittura costruire una presentazione da zero.
Connessioni intelligenti e capacità operative elevate
La vera forza dell’agente ChatGPT sta nelle sue connessioni con app e servizi esterni. Grazie ai ChatGPT connectors, può accedere a piattaforme come Gmail o GitHub per recuperare informazioni aggiornate e contestualizzate, senza dover chiedere all’utente di passare dati manualmente.
Ma non è tutto: questo agente ha accesso a un terminale per eseguire codice, e può sfruttare API per comunicare con app specifiche, ampliando enormemente le sue possibilità operative. OpenAI ha fatto esempi concreti: puoi chiedergli di organizzare la spesa per preparare una colazione giapponese per quattro persone, oppure di analizzare tre concorrenti e creare una presentazione con tutti i dati raccolti.
Questi compiti richiedono un’intelligenza che sa esplorare il web, pianificare più azioni diverse e utilizzare strumenti differenti in modo coordinato — caratteristiche che finora nessun agente AI aveva mostrato con questa efficacia.
Performance di livello e massima attenzione alla sicurezza
Dietro questo agente c’è un modello AI che si distingue per risultati di altissimo livello. Su test complessi come Humanity’s Last Exam, l’agente ChatGPT ha raggiunto un punteggio di 41,6%, raddoppiando quello dei modelli precedenti. Sul difficile benchmark matematico FrontierMath, ha ottenuto il 27,4%, un balzo enorme rispetto al 6,3% del miglior modello precedente.
Ma OpenAI non ha perso di vista i rischi legati a un agente così potente. Come riporta Tech Crunch, il nuovo modello è classificato “ad alta capacità” in ambiti delicati come armi biologiche e chimiche, aree in cui potrebbe teoricamente amplificare pericoli esistenti. Per questo motivo, sono stati attivati sistemi di sicurezza molto rigidi. Pertanto, ogni input dell’utente viene controllato da un sistema di monitoraggio in tempo reale, e se la richiesta riguarda temi sensibili, la risposta viene filtrata e controllata da un secondo livello di protezione.
In più, la funzione di memoria è disattivata. Nelle altre versioni, questa funzione permette al chatbot di ricordare dettagli delle conversazioni precedenti, ma OpenAI teme che, nel contesto agente, potrebbe essere usata per rubare dati tramite attacchi ai prompt. Questa scelta di sicurezza limita alcune funzionalità, ma tutela l’utente e previene abusi.
Nonostante l’impressionante potenza e le nuove possibilità, resta da vedere come l’agente ChatGPT si comporterà nel mondo reale, dove gli agenti AI finora si sono dimostrati spesso fragili e poco affidabili nel gestire attività complesse. OpenAI è convinta di aver fatto un grande passo avanti, ma la sfida rimane aperta.