Google Cloud accelera sulla propria strategia AI con una nuova generazione di chip proprietari, ma senza rompere con Nvidia. L’annuncio segna un passaggio importante nell’evoluzione dell’infrastruttura cloud, tra ambizioni di autonomia tecnologica e collaborazioni strategiche ancora centrali.
Innovazione nei chip AI: i vantaggi della nuova generazione
Google Cloud ha presentato l’ottava generazione delle sue unità di elaborazione tensoriale, le TPU, introducendo una novità significativa: la divisione in due modelli distinti. Il TPU 8t sarà dedicato all’addestramento dei modelli, mentre il TPU 8i sarà progettato per l’inferenza, cioè l’utilizzo operativo dei modelli una volta in produzione.
Questa distinzione consente una maggiore ottimizzazione delle risorse, adattando l’hardware alle diverse fasi del ciclo di vita dell’intelligenza artificiale. Sul fronte delle prestazioni, Google parla di addestramento fino a tre volte più veloce, un miglioramento dell’80% nel rapporto prestazioni/prezzo e la possibilità di collegare oltre un milione di TPU in un unico cluster.
L’obiettivo è chiaro: offrire più capacità di calcolo consumando meno energia e riducendo i costi per i clienti. Un passo che rafforza il posizionamento di Google non solo come provider cloud, ma come attore in grado di innovare profondamente anche sul piano hardware.
Google Cloud spinge sulle soluzioni proprietarie
La scelta di sviluppare chip su misura rientra in una strategia condivisa anche da altri hyperscaler, come Amazon e Microsoft, che stanno investendo sempre più in architetture interne per l’intelligenza artificiale.
Per Google, questo significa aumentare il controllo sull’intera filiera tecnologica, migliorando l’efficienza e la scalabilità dei propri servizi. Le TPU, nate come chip a basso consumo ottimizzati per operazioni tensoriali, rappresentano oggi una componente chiave dell’offerta cloud.
La possibilità di progettare hardware e software in modo integrato consente di rispondere con maggiore precisione alle esigenze dei carichi di lavoro AI. Tuttavia, questa evoluzione non implica una sostituzione immediata delle tecnologie esistenti, ma piuttosto un loro affiancamento strategico.
Concorrenza aperta tra chip AI: sfida diretta a Nvidia
Nonostante l’avanzata delle TPU, parlare di un attacco frontale a Nvidia sarebbe prematuro. Google stessa chiarisce che i nuovi chip non sono pensati per rimpiazzare completamente le GPU del colosso americano, ma per integrarle.
Anzi, l’azienda ha confermato che nel corso dell’anno renderà disponibile nel proprio cloud anche Vera Rubin, uno dei chip più recenti di Nvidia. Questo dimostra come la competizione si sviluppi su più livelli, tra autonomia e collaborazione.
Nel lungo periodo, la crescita delle soluzioni proprietarie potrebbe ridurre la dipendenza da Nvidia, soprattutto se le aziende continueranno a spostare i propri carichi di lavoro AI verso il cloud. Ma, allo stato attuale, scommettere contro Nvidia resta rischioso: il gruppo mantiene una posizione dominante nel mercato, come dimostra la sua enorme capitalizzazione.
I chip AI di Google Cloud restano compatibili con Nvidia
La strategia di Google è dunque quella della coesistenza. I clienti continueranno ad avere accesso sia alle TPU sia alle GPU Nvidia, scegliendo di volta in volta la soluzione più adatta alle proprie esigenze.
In questo contesto, Google ha anche annunciato una collaborazione con Nvidia per migliorare le prestazioni dei sistemi basati su GPU all’interno del proprio cloud. In particolare, le due aziende stanno lavorando su Falcon, una tecnologia di networking software sviluppata da Google e resa open source nel 2023 sotto l’egida dell’Open Compute Project.
Questo approccio rafforza l’ecosistema cloud, puntando su interoperabilità e prestazioni elevate, senza imporre scelte rigide ai clienti.
Nuovi chip AI: prospettive per il futuro del cloud computing
L’introduzione delle nuove TPU apre scenari interessanti per il futuro del cloud computing. La possibilità di disporre di hardware ottimizzato per specifiche funzioni AI consente di migliorare efficienza, costi e sostenibilità.
Allo stesso tempo, la collaborazione con Nvidia suggerisce che il mercato resterà ibrido ancora a lungo, con soluzioni diverse che convivono all’interno delle stesse piattaforme. In questo equilibrio tra competizione e partnership si giocherà una parte cruciale dell’evoluzione dell’intelligenza artificiale su scala globale.
Come orientarsi tra le nuove offerte di Google Cloud
Per le imprese, la sfida sarà comprendere quando utilizzare le TPU e quando affidarsi alle GPU Nvidia. Le nuove soluzioni di Google offrono vantaggi evidenti in termini di efficienza e ottimizzazione, soprattutto per workload specifici.
Allo stesso tempo, la presenza delle tecnologie Nvidia garantisce continuità e flessibilità, elementi fondamentali in un contesto in rapida evoluzione. La scelta finale dipenderà dai modelli utilizzati, dai costi e dalle esigenze di scalabilità.
Fonte: TechCrunch