OpenAI compie un nuovo passo nella propria evoluzione tecnologica annunciando Jalapeño, il primo Intelligence Processor sviluppato in collaborazione con Broadcom. Si tratta di un acceleratore progettato specificamente per l’inferenza dei grandi modelli linguistici (LLM), destinato a diventare il primo elemento di una piattaforma di calcolo multi-generazionale che le due aziende intendono sviluppare nei prossimi anni.
Il chip rappresenta un tassello centrale della strategia di OpenAI per costruire un’infrastruttura completa a supporto dei propri modelli e prodotti. Alla realizzazione del progetto hanno contribuito anche Broadcom e Celestica, che hanno curato aspetti legati all’implementazione del silicio, all’integrazione dei sistemi e alla produzione su larga scala.
Secondo OpenAI, i campioni ingegneristici di Jalapeño stanno già eseguendo carichi di lavoro di machine learning nei laboratori dell’azienda, compresi quelli legati a GPT-5.3-Codex-Spark.
Un chip progettato da zero per i modelli linguistici
A differenza di molte soluzioni presenti sul mercato, Jalapeño non nasce come un acceleratore generico adattato all’intelligenza artificiale. È stato invece sviluppato fin dall’inizio con l’obiettivo di rispondere alle esigenze specifiche dell’inferenza dei moderni LLM.
Il progetto è stato costruito sulla base dell’esperienza maturata da OpenAI nella gestione quotidiana di servizi come ChatGPT, Codex e le API dell’azienda. L’architettura è stata ottimizzata per gestire in modo più efficiente aspetti fondamentali come kernel, memoria, networking e sistemi di distribuzione dei modelli.
L’obiettivo dichiarato è combinare la potenza e il throughput dei migliori acceleratori AI attuali con latenze più vicine a quelle delle piattaforme specializzate per l’inferenza. Questo dovrebbe consentire una migliore gestione dei prodotti interattivi basati su modelli linguistici su larga scala.
Prestazioni ed efficienza energetica al centro del progetto
Sebbene le misurazioni definitive siano ancora in corso, OpenAI afferma che i primi test mostrano risultati promettenti. In particolare, Jalapeño dovrebbe offrire prestazioni per watt significativamente superiori rispetto alle soluzioni di riferimento attualmente disponibili sul mercato.
La progettazione del chip punta a ridurre gli spostamenti di dati all’interno del sistema e a bilanciare in maniera più efficace risorse di calcolo, memoria e rete. Questo approccio dovrebbe permettere di raggiungere livelli di utilizzo dell’hardware molto più vicini ai limiti teorici delle sue capacità.
Un ruolo importante è svolto anche dalle tecnologie di networking di Broadcom, compresi i componenti della famiglia Tomahawk, pensati per supportare la produzione e l’impiego del sistema su vasta scala.
Sviluppato in nove mesi grazie anche all’AI
Uno degli aspetti più rilevanti del progetto riguarda i tempi di sviluppo. OpenAI e Broadcom hanno infatti completato il percorso che va dalla progettazione iniziale al tape-out produttivo in appena nove mesi.
Secondo le aziende coinvolte, si tratta di quello che ritengono essere il ciclo di sviluppo ASIC più rapido mai raggiunto nel settore dei semiconduttori avanzati ad alte prestazioni.
A contribuire a questa accelerazione è stato anche l’utilizzo dei modelli di OpenAI durante alcune fasi della progettazione e dell’ottimizzazione. In pratica, la stessa intelligenza artificiale utilizzata dagli utenti è stata impiegata per migliorare l’infrastruttura destinata a supportare le future generazioni di modelli.
Una piattaforma multi-generazionale per i data center del futuro
Jalapeño rappresenta soltanto il primo passo di una roadmap più ampia. OpenAI, Broadcom e Celestica stanno infatti lavorando a una piattaforma di calcolo multi-generazionale che dovrebbe iniziare a essere distribuita entro la fine del 2026.
La visione delle aziende coinvolte prevede l’impiego di questi acceleratori in data center di scala gigawatt, grazie anche alla collaborazione con partner come Microsoft.
Per OpenAI, il vero obiettivo è rendere l’intelligenza artificiale più veloce, affidabile ed economica. Ogni miglioramento nell’infrastruttura può tradursi in risposte più rapide di ChatGPT, costi inferiori per gli sviluppatori che utilizzano le API e una maggiore disponibilità dei servizi nei momenti di forte domanda.
Secondo l’azienda, una riduzione dei costi di inferenza e un aumento dell’efficienza possono contribuire a rendere l’AI avanzata accessibile a un numero crescente di utenti, sviluppatori, ricercatori, imprese e studenti in tutto il mondo.