DeepSeek ha rilasciato un importante aggiornamento al suo modello di intelligenza artificiale, attirando nuovamente l’attenzione del settore. Il nuovo modello, denominato DeepSeek V3-0324, è ora disponibile su Hugging Face e si posiziona come un concorrente sempre più agguerrito rispetto a OpenAI e ad altri sviluppatori di AI.
DeepSeek V3-0324, il nuovo modello che sfida OpenAI e Anthropic
DeepSeek è un’azienda relativamente giovane, fondata appena un anno fa, ma il suo sviluppo è stato incredibilmente veloce. A dicembre è stato presentato il primo modello V3, seguito a gennaio dal modello R1, più orientato alla ricerca avanzata. Ora, con il rilascio di V3-0324, DeepSeek conferma la sua ambizione di scalare rapidamente le gerarchie del settore AI. Il nuovo modello, come suggerisce il nome, è stato sviluppato e rilasciato a marzo 2024.
Secondo i test dell’azienda, DeepSeek V3-0324 presenta miglioramenti significativi nelle capacità di ragionamento e di codifica. In particolare, ha ottenuto un punteggio di 59,4 nell’American Invitational Mathematics Examination, rispetto al 39,6 del suo predecessore, secondo un report del South China Morning Post. Ha inoltre guadagnato 10 punti su LiveCodeBench, raggiungendo un punteggio di 49,2. Il nuovo modello, con 685 miliardi di parametri, utilizza una licenza software MIT, a differenza di DeepSeek V3, che ha 671 miliardi di parametri e una licenza commerciale.
Anche se questi progressi potrebbero non sembrare rivoluzionari presi singolarmente, il ritmo con cui l’azienda sta affinando le proprie tecnologie è notevole. Inoltre, un aspetto chiave della sua strategia è il costo: DeepSeek offre prestazioni paragonabili a GPT-4 di OpenAI o a Claude 2 di Anthropic, ma con un prezzo nettamente inferiore.
La supremazia degli Stati Uniti nello sviluppo di modelli AI sta iniziando a vacillare, complice la crescita di startup cinesi come DeepSeek. Non è più una sorpresa che le innovazioni più rilevanti arrivino da città come Shenzhen o Hangzhou. Questo cambiamento di equilibri ha portato a reazioni contrastanti: mentre alcuni vedono in DeepSeek un’alternativa interessante ai giganti occidentali, altri, come il governo statunitense, stanno valutando restrizioni e possibili divieti per le tecnologie AI cinesi.
Nonostante il grande clamore, il rilascio di DeepSeek-V3-0324 non avrà un impatto immediato sulla vita quotidiana degli utenti. Tuttavia, il nuovo modello potrebbe essere un indizio che la crescente richiesta di potenza di calcolo e di energia per supportare l’intelligenza artificiale potrebbe non essere così insostenibile come temuto. La sfida tra DeepSeek e OpenAI si gioca non solo sulla potenza dei modelli, ma anche sulla capacità di rendere queste tecnologie più accessibili ed economicamente sostenibili.