Ormai non è più una competizione, ma una guerra quella che sta coinvolgendo i colossi tech americani. In questa frenesia di sviluppare e presentare modelli AI sempre più sofisticati, Microsoft è sul punto di lanciare un altro LLM (Large Language Model): MAI-1. E con esso entrare ancora più in competizione contro l’avversaria di sempre Google e addirittura la sua “spalla” OpenAI.
MAI-1, il nuovo modello AI di Microsoft
Riportano Reuters e Ars Technica, Microsoft sta lavorando su un nuovo modello linguistico di intelligenza artificiale, chiamato MAI-1. Ma non aveva già presentato un altro modelli AI? Vero, ma a differenza di Phi-3, in questo caso si tratta di un LLM, un modello linguistico di grandi dimensioni.
È la prima volta che Microsoft sviluppa un modello di intelligenza artificiale di questa portata. Almeno in proprio, se si conta il super-investimento da oltre 10 miliardi di dollari in OpenAI per riutilizzare i modelli di intelligenza artificiale della startup. Ricordiamo infatti che GPT-4 di OpenAI alimenta non solo ChatGPT, ma anche Microsoft Copilot.
Sviluppo guidato da Mustafa Suleyman, ex leader di Google AI e oggi CEO di Inflection (oggi dentro Microsoft con l’acquisizione delle quote maggioritarie a marzo), secondo The Information Microsoft potrebbe anticipare la presentazione di MAI-1 già alla sua conferenza per sviluppatori di questo mese.
Come funziona il nuovo LLM di Microsoft
Con circa 500 miliardi di parametri, precisa Ars Technica, MAI-1 dovrebbe risultare significativamente più grande rispetto ai precedenti modelli open source di Microsoft, richiedendo pertanto più potenza di calcolo e dati di allenamento. Nonostante l’enormità dei dati, è ancora inferiore rispetto al GPT-4 di OpenAI, il quale si dice abbia oltre 1 trilione di parametri. È comunque più potente dei vari modelli light oggi in circolazione, come quelli da 70 miliardi di parametri di Meta AI e Mistral.
Lo sviluppo di MAI-1 suggerisce un approccio duale all’intelligenza artificiale all’interno di Microsoft, concentrandosi sia su modelli linguistici di piccole dimensioni, eseguiti localmente su dispositivi mobili, che su modelli all’avanguardia di grandi dimensioni alimentati dal cloud (come quello su cui sta lavorando Apple).
Secondo quanto riferito, lo scopo esatto di MAI-1 non è stato ancora determinato (anche all’interno di Microsoft), e il suo utilizzo ideale dipenderà dalle sue prestazioni. Per addestrare il modello, Microsoft sta allocando un grande cluster di server con GPU NVIDIA e compilando dati di allenamento da varie fonti, tra cui testi generati dal GPT-4 di OpenAI e dati pubblici provenienti da Internet.