Anthropic lancia Claude 3.5 Sonnet e punta a superare GPT-4o

Claude 3.5 Sonnet, l’ultima intelligenza artificiale di Anthropic, sembra voglia superare a tutti i costi GPT-4o. Ma ce la farà?

morghy il robottino giornalista
Morghy, il robottino giornalista
claude AI

Dopo l’uscita di GPT-4o a maggio, la competizione tra intelligenze artificiali è diventata ancora più serrata. Dopo Gemini, Apple Intelligence e tanto altro, non poteva non mancare all’appello Anthropic, che infatti ha recentemente annunciato il lancio di Claude 3.5 Sonnet, un ambizioso modello AI della famiglia Claude 3.5. Talmente ambizioso da voler superare (guarda caso) GPT-4o.

Claude 3.5 Sonnet, tutte le particolarità della nuova AI di Anthropic

Superiore non solo ai modelli concorrenti, ma anche al precedente Claude 3 Opus. E tutto questo pur mantenendo la velocità e il costo di un modello di fascia media della famiglia Claude.

Questo è Claude 3.5 Sonnet, l’ultimo modello AI firmata Anthropic.

In sostanza, Claude 3.5 Sonnet è in grado di scrivere, modificare ed eseguire codice autonomamente, ma rispetto ai modelli precedenti è dotato di sofisticate e migliori capacità di ragionamento e risoluzione dei problemi. Inoltre è efficiente nella traduzione di codice tra linguaggi diversi, rendendolo ideale per aggiornamenti di applicazioni esistenti e migrazione del codice.

Al momento Sonnet è disponibile gratuitamente su Claude.ai e tramite l’app Claude per iOS. Se si è abbonati ai piani Claude Pro e Team, oltre all’accesso si potranno ricevere funzionalità extra e limiti di token superiori.

Per saperne di più: Intelligenza artificiale: cos’è e come funziona, tutto sulla AI

Claude superiore a GPT-4o?

Stando ad alcuni benchmark pubblicati dalla società, Claude 3.5 Sonnet è talmente potente da addirittura superare GPT-4o, l’ultima intelligenza artificiale di casa OpenAI. Ma è davvero così?

Per certi versi Claude 3.5 Sonnet mostra notevoli miglioramenti nella comprensione delle sfumature, dell’umorismo e delle istruzioni complesse, eccellendo nella creazione di contenuti di alta qualità con un tono naturale e relazionabile.

Ma lo è anche GPT-4o, allora come si fa a capire chi tra i due è superiore?

In questo caso, tocca andare sul tecnico. Secondo i test effettuati, Claude 3.5 Sonnet ha risolto il 64% dei problemi, superando il 38% di Claude 3 Opus. Mentre rispetto a GPT-4o, Sonnet è superiore a livello di elaborazione GPQA (Graduate level reasoning), Undergraduate level knowledge e nel Grade school math, e così per quanto riguardano i parametri Code HumanEvat, Multilingual math, Reasoning over text e Mixed evaluations.

Tutti livelli e parametri indicativi di un’effettiva superiorità tecnologica, sebbene il tabellario dei parametri presente sul sito dell’azienda non indichi una distanza così abissale tra i due. Inutile dire che nel lungo periodo le intelligenze artificiali tendono a superarsi tra loro, e forse Claude è sulla buona strada per riuscirci. Il problema è se OpenAI non proponga nel mentre qualcosa di nuovo, tipo GPT-5.

Iscriviti alla newsletter

Non inviamo spam! Leggi la nostra Informativa sulla privacy per avere maggiori informazioni.