Microsoft lancia la nuova famiglia di modelli Phi-3.5

Tre membri nella nuova famiglia di modelli AI di Microsoft: Phi-3.5-vision, Phi-3.5-MoE e Phi-3.5-mini. Tutti e tre progettati per essere leggeri e performanti, e sviluppati utilizzando dati sintetici e informazioni provenienti da siti web. Oltre a supportare una lunghezza del contesto di 128.000 token, questi nuovi modelli offrono diverse funzioni e prestazioni di alta qualità.

La nuova famiglia AI di Microsoft

Disponibili ora sulla piattaforma Hugging Face con licenza MIT, la famiglia Phi-3.5 di Microsoft rappresenta un passo avanti nell’efficienza e nelle capacità dei modelli di intelligenza artificiale, con un’attenzione particolare alla progettazione leggera e alla comprensione multimodale.

Ma vediamo meglio le principali caratteristiche di ognuno dei “familiari”.

Per saperne di più: Intelligenza artificiale: cos’è e come funziona, tutto sulla AI

Phi-3.5-MoE: innovazione con la tecnologia Mixture of Experts

Il Phi-3.5-MoE rappresenta un’innovazione significativa all’interno della famiglia Phi, essendo il primo modello a integrare la tecnologia Mixture of Experts (MoE). Con 16 gruppi di 3,8 miliardi di parametri, il modello attiva solo 6,6 miliardi di parametri alla volta, ottimizzando così l’efficienza computazionale.

Addestrato su 4,9 trilioni di token, nei principali benchmark di intelligenza artificiale il Phi-3.5-MoE ha superato modelli rinomati come Llama 3.1, Gemma 2 e Gemini 1.5 Flash, avvicinandosi al livello di prestazioni di GPT-4o mini, uno dei modelli più avanzati attualmente sul mercato.

Phi-3.5-mini: potenza in formato ridotto

Il modello Phi-3.5-mini, con i suoi 3,8 miliardi di parametri, dimostra che anche le soluzioni più compatte possono competere con modelli molto più grandi. Questo modello è stato addestrato su 3,4 trilioni di token, e riesce a competere efficacemente sui compiti multilingue, pur mantenendo un numero relativamente basso di parametri attivi.

Inoltre, Phi-3.5-mini supporta ora una lunghezza del contesto di 128.000 token, un valore significativamente superiore rispetto ai suoi principali concorrenti, come la famiglia dei modelli Gemma 2, che si ferma a 8.000 token.

Phi-3.5-vision: miglioramenti nella comprensione delle immagini

Il modello Phi-3.5-vision, con i suoi 4,2 miliardi di parametri, si distingue per la sua capacità avanzata di comprensione e ragionamento su immagini multi-frame.

Addestrato su 500 miliardi di token, questo modello ha mostrato miglioramenti significativi in diversi benchmark. A titolo d’esempio, su TextVQA (un benchmark per la comprensione dei documenti) il suo livello è salito da 70,9 a 72,0.

Questi progressi evidenziano il continuo impegno di Microsoft nel migliorare le capacità dei suoi modelli AI, in particolare per quanto riguarda l’interpretazione delle immagini.

La nuova famiglia AI di Microsoft

Phi-3.5-MoE: innovazione con la tecnologia Mixture of Experts

Phi-3.5-mini: potenza in formato ridotto

Phi-3.5-vision: miglioramenti nella comprensione delle immagini

Iscriviti alla newsletter

Articoli correlati