Baidu accelera sull’AI cloud: la nuova piattaforma punta tutto sugli agenti intelligenti

Il colosso cinese presenta nuove tecnologie per ottimizzare training, caching e applicazioni basate su agenti intelligenti

Redazione
Infrastruttura baidu cloud ai con agenti intelligenti e cluster GPU

Baidu rilancia la propria strategia nel settore dell’intelligenza artificiale con una trasformazione profonda della sua infrastruttura cloud. Durante il Create 2026, il gruppo cinese ha annunciato un aggiornamento completo di Baidu Cloud, ora ripensata come piattaforma AI full-stack orientata all’era degli agenti intelligenti. L’obiettivo dichiarato è migliorare sia l’efficienza computazionale sia le prestazioni energetiche, puntando su nuove architetture software e hardware dedicate alle applicazioni AI su larga scala.

Tra le principali novità figurano il nuovo sistema “Token Factory”, un’infrastruttura progettata per ridurre il ricalcolo dei token durante le inferenze, e l’evoluzione dell’hardware Kunlun P800, già validato in cluster da oltre 10.000 GPU. Baidu punta così a rafforzare il proprio ruolo nella competizione globale dell’AI cloud, in un mercato sempre più orientato verso agenti autonomi e modelli multimodali avanzati.

Il cloud agent-first diventa il centro della strategia Baidu

Nel corso della conferenza Create 2026, Shen Dou, Executive Vice President di Baidu, ha spiegato che la piattaforma cloud dell’azienda è stata completamente riprogettata per supportare applicazioni AI basate su agenti intelligenti. La precedente struttura MaaS Model Service è stata sostituita dalla nuova “Token Factory”, sviluppata secondo un’architettura agent-first.

Il sistema consente di ridurre al minimo il ricalcolo dei token durante i processi di inferenza, migliorando la velocità di generazione di circa il 25% rispetto ai benchmark di mercato indicati dall’azienda. Inoltre, la piattaforma supporta diversi modelli AI cinesi, tra cui Ernie, DeepSeek, GLM e MiniMax.

Accanto alla Token Factory, Baidu ha introdotto anche una nuova soluzione chiamata “Harness Engineering”, che include funzionalità dedicate alla gestione dei contesti lunghi, memoria persistente, orchestrazione di sub-agent e capacità runtime avanzate.

KV Cache oltre il 90% e prestazioni AI triplicate

Uno dei punti chiave dell’aggiornamento riguarda l’infrastruttura AI sottostante. Baidu ha sviluppato un’architettura a pool stratificati per la gestione combinata di memoria GPU, DRAM e SSD. Questa configurazione consente di ottenere un KV Cache hit rate superiore al 90%, riducendo sensibilmente i tempi di accesso ai dati e migliorando la fluidità delle inferenze AI.

Secondo quanto comunicato dall’azienda, le prestazioni nelle inferenze a catena lunga per agenti intelligenti risultano fino a tre volte superiori rispetto ai principali motori open source oggi disponibili sul mercato. Anche il training beneficia delle nuove ottimizzazioni: il framework multimodale unificato sviluppato da Baidu permette infatti di raggiungere un’efficienza doppia rispetto agli standard della community AI.

Kunlun P800 e cluster da 10.000 GPU

Grande attenzione è stata dedicata anche all’hardware proprietario Kunlun P800. Baidu ha annunciato di aver completato la validazione su larga scala dei nuovi cluster basati su questa tecnologia, raggiungendo un tasso di training effettivo del 97% e uno scaling lineare superiore all’85%.

L’azienda ha inoltre confermato il lancio, previsto per giugno, del supernode Tianchi da 256 schede acceleratrici basato proprio su Kunlun. Parallelamente, il gruppo ha annunciato aggiornamenti ai propri data center AI su scala gigawatt, con una nuova architettura di raffreddamento wind-liquid cooling che riduce di circa il 30% i tempi di costruzione delle infrastrutture.

Baidu punta alla leadership globale nell’AI cloud

Le novità presentate al Create 2026 mostrano chiaramente la volontà di Baidu di rafforzare la propria presenza internazionale nel mercato dell’intelligenza artificiale. L’integrazione di infrastrutture agent-first, sistemi di caching avanzati e hardware dedicato punta a creare una piattaforma cloud capace di sostenere applicazioni AI sempre più autonome e complesse.

L’azienda cinese mira così a offrire prestazioni elevate sia sul fronte dell’efficienza energetica sia su quello della velocità computazionale, elementi diventati centrali nella competizione globale tra i principali operatori del settore cloud e AI.

Passi operativi per aziende e innovatori

Le aziende che desiderano sfruttare l’intelligenza artificiale dovrebbero valutare con attenzione le nuove capacità della Baidu cloud full stack AI. Innovatori e sviluppatori possono trarre vantaggio dall’efficienza dei sistemi Baidu per accelerare roadmap tecnologiche e processi decisionali fondamentali.

Fonte: Pandaily

Iscriviti alla newsletter

Non inviamo spam! Leggi la nostra Informativa sulla privacy per avere maggiori informazioni.