Nelle ultime ore OpenAI ha presentato GPT-4o mini, il suo ultimo modello AI di piccole dimensioni. L’obiettivo è fornire qualcosa di leggero ed economico per gli sviluppatori per creare tutte le app e gli strumenti che non potrebbero permettersi di realizzare con un modello più grande e costoso come GPT-4.
Benvenuto GPT-4o mini
L’azienda afferma che GPT-4o mini supera i modelli AI di piccole dimensioni leader del settore nelle attività di ragionamento che coinvolgono testo e visione e supporta la stessa gamma di linguaggi di GPT-4o. Nello specifico il nuovo modello AI è stato valutato attraverso diversi benchmark chiave quali:
– Attività di ragionamento: GPT-4o mini è migliore di altri piccoli modelli nelle attività di ragionamento che coinvolgono sia testo che visione, ottenendo un punteggio dell’82,0% su MMLU, un benchmark di ragionamento e intelligenza testuale, rispetto al 77,9% di Gemini Flash e al 73,8% di Claude Haiku.
– Competenza in matematica e codifica: il modello eccelle nel ragionamento matematico e nelle attività di codifica, superando i precedenti modelli di piccole dimensioni sul mercato. Su MGSM, che misura il ragionamento matematico, GPT-4o mini ha ottenuto l’87,0%, rispetto al 75,5% di Gemini Flash e al 71,7% di Claude Haiku. Il modello ha anche ottenuto l’87,2% su HumanEval, che misura le prestazioni di codifica, rispetto al 71,5% di Gemini Flash e al 75,9% di Claude Haiku.
– Ragionamento multimodale: il modello mostra ottime prestazioni anche nel MMMU, una valutazione del ragionamento multimodale, ottenendo un punteggio del 59,4% rispetto al 56,1% di Gemini Flash e al 50,2% di Claude Haiku.
Per saperne di più: Intelligenza artificiale: cos’è e come funziona, tutto sulla AI
A partire da oggi, gli utenti di ChatGPT con piani Free, Plus e Team possono usare GPT-4o Mini invece di GPT-3.5 Turbo, mentre gli utenti Enterprise avranno accesso la prossima settimana. Ciò significa che GPT-3.5 non sarà più un’opzione per gli utenti di ChatGPT, ma sarà comunque disponibile per gli sviluppatori tramite API se preferiscono non passare a al nuovo modello, almeno per il momento. Sembra, infatti che la versione 3.5 Turbo verrà presto eliminata.
Per quanto riguarda il tema sicurezza, anche il nuovo chatbot ha le stesse misure di sicurezza integrate di GPT-4o, che l’azienda ha attentamente valutato utilizzando valutazioni sia automatizzate che umane.
“Sulla base di questi apprendimenti, i nostri team hanno anche lavorato per migliorare la sicurezza del modello utilizzando nuove tecniche informate dalla nostra ricerca. GPT-4o mini nell’API è il primo modello ad applicare la nostra gerarchia di istruzioni(Si apre in una nuova finestra)metodo, che aiuta a migliorare la capacità del modello di resistere a jailbreak, iniezioni rapide ed estrazioni rapide di sistema. Ciò rende le risposte del modello più affidabili e contribuisce a renderlo più sicuro da usare in applicazioni su larga scala“, ha detto OpenAI in una nota.