NVIDIA Rubin, il supercomputer AI del futuro

Con NVIDIA Rubin, la prossima generazione di supercomputer AI punta a prestazioni senza precedenti per aziende e laboratori

Redazione

NVIDIA accelera sulla prossima generazione di intelligenza artificiale con il lancio della piattaforma Rubin, una nuova architettura pensata per ridefinire il modo in cui vengono costruiti, addestrati e distribuiti i sistemi di AI su larga scala. Presentata al CES 2026, Rubin riunisce sei nuovi chip in un’unica infrastruttura concepita come un vero e proprio supercomputer per l’AI, puntando a ridurre drasticamente tempi e costi di training e inferenza.

Un supercomputer basato su sei chip e codesign estremo

In omaggio a Vera Florence Cooper Rubin, astronoma americana che ha contribuito in modo decisivo alla comprensione della struttura dell’universo, la nuova piattaforma nasce per rispondere a una domanda di calcolo in rapida crescita, sia per l’addestramento dei modelli sia per l’esecuzione delle applicazioni AI avanzate. Secondo NVIDIA, Rubin consente fino a 10 volte di riduzione del costo per token in inferenza e richiede quattro volte meno GPU per addestrare modelli Mixture-of-Experts rispetto alla generazione precedente Blackwell.

Disponibile in due soluzioni principali (Vera Rubin NVL72 a livello rack-scale, e HGX Rubin NVL8 per data center e infrastrutture AI più avanzate), Rubin si basa su un approccio di codesign estremo tra hardware e software, applicato a sei componenti chiave: NVIDIA Vera CPU, NVIDIA Rubin GPU, NVLink 6 Switch, ConnectX-9 SuperNIC, BlueField-4 DPU e Spectrum-6 Ethernet Switch. Proprio questa integrazione consente di comprimere i tempi di addestramento e di abbattere i costi di generazione dei token in fase di inferenza. NVIDIA ha declinato l’architettura in due soluzioni principali:

Tra le principali novità tecniche introdotte figurano le nuove generazioni di NVLink, il Transformer Engine, il RAS Engine, il Confidential Computing e l’arrivo della Vera CPU, progettata per lavorare in sinergia con le GPU Rubin. L’insieme di queste innovazioni è pensato per accelerare l’AI agentica, il ragionamento avanzato e l’inferenza su modelli MoE su scala massiva.

Adozione industriale e supporto dell’ecosistema

C’è da dire che Rubin arriva sul mercato con un forte supporto da parte dell’ecosistema tecnologico globale. Tra le aziende e i laboratori AI pronti ad adottare la piattaforma figurano AWS, Google, Microsoft, Meta, OpenAI, Anthropic, Oracle, Dell, HPE, Lenovo e numerose startup specializzate nell’intelligenza artificiale.

Microsoft ha annunciato che le sue Fairwater AI superfactories di nuova generazione utilizzeranno sistemi NVIDIA Vera Rubin NVL72, con l’obiettivo di scalare fino a centinaia di migliaia di Superchip Rubin. Anche CoreWeave sarà tra i primi provider a offrire Rubin, gestendolo tramite la piattaforma Mission Control per garantire flessibilità operativa e prestazioni elevate.

Sul fronte software, NVIDIA ha ampliato la collaborazione con Red Hat per fornire uno stack AI completo e ottimizzato, basato su Red Hat Enterprise Linux, OpenShift e Red Hat AI. Secondo Jensen Huang, fondatore e CEO di NVIDIA, Rubin arriva “nel momento giusto”, segnando un nuovo passo nella strategia di rilascio annuale di supercomputer AI e ponendo le basi per una diffusione più ampia dell’intelligenza artificiale avanzata.

Iscriviti alla newsletter

Non inviamo spam! Leggi la nostra Informativa sulla privacy per avere maggiori informazioni.