Microsoft svela tre nuovi modelli AI multimodali

La nuova suite mira a trascrizione rapida, audio personalizzato e generazione video per sviluppatori e aziende

Redazione

Microsoft ha annunciato recentemente il rilascio di tre modelli di intelligenza artificiale fondamentali in grado di generare testo, voce e immagini, segnando un passo importante nella strategia dell’azienda per sviluppare un proprio ecosistema multimodale AI e competere con altri laboratori, pur mantenendo la partnership con OpenAI.

Modelli avanzati per trascrizione, voce e immagini

In breve, il primo modello, MAI-Transcribe-1, consente di trascrivere il parlato in testo in 25 lingue diverse e, secondo Microsoft, è 2,5 volte più veloce rispetto all’offerta Azure Fast.

Mentre MAI-Voice-1 permette invece di generare audio, producendo 60 secondi di voce in un solo secondo, con la possibilità di creare voci personalizzate.

Infine, MAI-Image-2 si occupa della generazione video, già disponibile su MAI Playground dal 19 marzo.

Ora tutti e tre i modelli sono accessibili anche tramite Microsoft Foundry, mentre quelli di trascrizione e voce restano disponibili su MAI Playground.

Stando a quanto riportato da TechCrunch, i modelli sono stati sviluppati dal team MAI Superintelligence, guidato da Mustafa Suleyman, CEO di Microsoft AI, istituito nel novembre 2025.

Costi e competitività sul mercato

Microsoft punta a differenziarsi in un mercato dei grandi modelli linguistici sempre più affollato offrendo soluzioni più economiche rispetto a Google e OpenAI.

I prezzi partono da 0,36 dollari all’ora per MAI-Transcribe-1, 22 dollari per 1 milione di caratteri con MAI-Voice-1, e per MAI-Image-2 5 dollari per 1 milione di token di testo e 33 dollari per 1 milione di token di output immagini.

Questa strategia rappresenta un tentativo di rendere l’adozione dei modelli AI più accessibile a sviluppatori e aziende, consentendo loro di integrare funzionalità avanzate in prodotti e servizi con costi contenuti.

Partnership e investimenti strategici

Nonostante il lancio dei propri modelli, Microsoft ha ribadito il commitment con OpenAI. Una recente rinegoziazione della partnership ha permesso all’azienda di perseguire in modo più indipendente la ricerca sulla superintelligenza. Microsoft ha investito oltre 13 miliardi di dollari nel laboratorio AI e integra i modelli nei propri prodotti attraverso un accordo pluriennale.

Analogamente alla strategia sui chip, Microsoft combina produzione interna e acquisto da fornitori esterni, garantendo così flessibilità e scalabilità nello sviluppo tecnologico.

Suleyman ha anticipato che nuovi modelli saranno presto disponibili sia in Foundry sia direttamente nei prodotti Microsoft, confermando la volontà dell’azienda di consolidare la propria posizione nel settore dell’intelligenza artificiale multimodale.

Iscriviti alla newsletter

Non inviamo spam! Leggi la nostra Informativa sulla privacy per avere maggiori informazioni.