Minerva 7B, la nuova versione dell’AI che sfida ChatGPT

Presentata l’ultima versione di Minerva, il modello linguistico AI targato Sapienza nonché la risposta italiana a ChatGPT

Redazione

Nuovo passo avanti per l’intelligenza artificiale in Italia con Minerva 7B, l’ultima versione della famiglia dei modelli Minerva sviluppata dal gruppo di ricerca Sapienza NLP (Università La Sapienza di Roma), che con i suoi 7 miliardi di parametri si conferma un punto di riferimento per la ricerca e l’innovazione italiana nell’ambito dei Large Language Models (LLM).

Minerva 7B, la nuova frontiera dell’AI Made in Italy

Realizzato all’interno del progetto Fair (Future Artificial Intelligence Research) grazie ai fondi del PNRR, Minerva 7B è, nelle parole di Roberto Navigli (docente alla guida del gruppo Sapienza NLP),

“[…] il primo – e a oggi unico – modello completamente aperto, che si presta a essere utilizzato dalle Pubbliche amministrazioni, proprio per la trasparenza delle fonti e del processo di addestramento”.

Si tratta di un modello potenziato da 7 miliardi di parametri (quello precedente ne contava 3), nonché addestrato “anche per rispondere a domande e istruzioni, comandi“. Durante la demo dell’ultima versione, riferisce l’Università in una nota, lo stesso Navigli ha presentato diverse conversazioni con il modello, tra cui la richiesta di scrivere una favola e di tradurre e riassumere un breve testo, e ha mostrato la robustezza del modello a richieste che potrebbero generare contenuti sensibili o discriminatori.

Per saperne di più: Intelligenza artificiale: cos’è e come funziona, tutto sulla AI

L’intelligenza artificiale satefy al servizio della società

Date queste caratteristiche, Minerva 7B è in pratica la risposta italiana a ChatGPT. Ma con la particolarità di essere safety. Infatti, racconta Navigli all’ANSA,

“[…] abbiamo fatto un lavoro importante sulla sicurezza del modello, la cosiddetta safety, cioè la capacità del modello di evitare e rispondere a domande che potrebbe portare alla generazione di contenuti indesiderati o malevoli. [Inoltre] a differenza di ChatGPT o Gemini, che sono modelli chiusi così come anche Mistral o Llama3 che sono scaricabili, Minerva appartiene a quella ristretta famiglia di modelli aperti, ossia che è possibile analizzare liberamente”.

Il team della Sapienza NLP ha lavorato per oltre cinque mesi per raggiungere questo traguardo, processando oltre 2 trilioni di token corrispondenti a circa 1,5 trilioni di parole. Grazie a collaborazioni con enti pubblici e privati (tra cui Cineca che ha fornito la potenza computazionale del supercomputer Leonardo), il progetto mira a estendere l’applicazione di Minerva in ambiti istituzionali e industriali.

Minerva 7B è già accessibile al pubblico tramite il sito www.minerva-llm.org. Gli utenti potranno testare le capacità del modello e contribuire al suo perfezionamento grazie ai feedback raccolti durante questa fase iniziale.

Iscriviti alla newsletter

Non inviamo spam! Leggi la nostra Informativa sulla privacy per avere maggiori informazioni.