NVIDIA Rubin, il supercomputer AI del futuro

NVIDIA accelera sulla prossima generazione di intelligenza artificiale con il lancio della piattaforma Rubin, una nuova architettura pensata per ridefinire il modo in cui vengono costruiti, addestrati e distribuiti i sistemi di AI su larga scala. Presentata al CES 2026, Rubin riunisce sei nuovi chip in un’unica infrastruttura concepita come un vero e proprio supercomputer per l’AI, puntando a ridurre drasticamente tempi e costi di training e inferenza.

Un supercomputer basato su sei chip e codesign estremo

In omaggio a Vera Florence Cooper Rubin, astronoma americana che ha contribuito in modo decisivo alla comprensione della struttura dell’universo, la nuova piattaforma nasce per rispondere a una domanda di calcolo in rapida crescita, sia per l’addestramento dei modelli sia per l’esecuzione delle applicazioni AI avanzate. Secondo NVIDIA, Rubin consente fino a 10 volte di riduzione del costo per token in inferenza e richiede quattro volte meno GPU per addestrare modelli Mixture-of-Experts rispetto alla generazione precedente Blackwell.

Disponibile in due soluzioni principali (Vera Rubin NVL72 a livello rack-scale, e HGX Rubin NVL8 per data center e infrastrutture AI più avanzate), Rubin si basa su un approccio di codesign estremo tra hardware e software, applicato a sei componenti chiave: NVIDIA Vera CPU, NVIDIA Rubin GPU, NVLink 6 Switch, ConnectX-9 SuperNIC, BlueField-4 DPU e Spectrum-6 Ethernet Switch. Proprio questa integrazione consente di comprimere i tempi di addestramento e di abbattere i costi di generazione dei token in fase di inferenza. NVIDIA ha declinato l’architettura in due soluzioni principali:

Tra le principali novità tecniche introdotte figurano le nuove generazioni di NVLink, il Transformer Engine, il RAS Engine, il Confidential Computing e l’arrivo della Vera CPU, progettata per lavorare in sinergia con le GPU Rubin. L’insieme di queste innovazioni è pensato per accelerare l’AI agentica, il ragionamento avanzato e l’inferenza su modelli MoE su scala massiva.

Adozione industriale e supporto dell’ecosistema

C’è da dire che Rubin arriva sul mercato con un forte supporto da parte dell’ecosistema tecnologico globale. Tra le aziende e i laboratori AI pronti ad adottare la piattaforma figurano AWS, Google, Microsoft, Meta, OpenAI, Anthropic, Oracle, Dell, HPE, Lenovo e numerose startup specializzate nell’intelligenza artificiale.

Microsoft ha annunciato che le sue Fairwater AI superfactories di nuova generazione utilizzeranno sistemi NVIDIA Vera Rubin NVL72, con l’obiettivo di scalare fino a centinaia di migliaia di Superchip Rubin. Anche CoreWeave sarà tra i primi provider a offrire Rubin, gestendolo tramite la piattaforma Mission Control per garantire flessibilità operativa e prestazioni elevate.

Sul fronte software, NVIDIA ha ampliato la collaborazione con Red Hat per fornire uno stack AI completo e ottimizzato, basato su Red Hat Enterprise Linux, OpenShift e Red Hat AI. Secondo Jensen Huang, fondatore e CEO di NVIDIA, Rubin arriva “nel momento giusto”, segnando un nuovo passo nella strategia di rilascio annuale di supercomputer AI e ponendo le basi per una diffusione più ampia dell’intelligenza artificiale avanzata.

Un supercomputer basato su sei chip e codesign estremo

Adozione industriale e supporto dell’ecosistema

Iscriviti alla newsletter

Articoli correlati