Economia Digitale

OpenAI accende Jalapeño: perché il futuro dell’intelligenza artificiale passa dai chip?

L’obiettivo è ridurre costi, consumi e dipendenza da Nvidia. Come Google, Microsoft e Amazon, anche OpenAI punta a controllare l’hardware

di Luca Tremolada

FILE PHOTO: OpenAI logo is seen in this illustration taken June 11, 2026. REUTERS/Dado Ruvic/Illustration/File Photo REUTERS

3' di lettura

English Version

3' di lettura

English Version

OpenAI entra ufficialmente nel club più esclusivo della Silicon Valley: quello delle aziende che non si limitano più a scrivere software, ma progettano anche l’hardware su cui quel software gira.

Domande di approfondimento generate da 24Ore AI

Il nuovo chip si chiama Jalapeño e come missione ha quella di abbassare il costo dell’intelligenza artificiale e aumentare la potenza di calcolo disponibile. L’annuncio è arrivato da OpenAI insieme a Broadcom, il colosso dei semiconduttori che negli ultimi due anni è diventato uno degli attori chiave dell’economia AI. In pratica Jalapeño è il primo chip proprietario di OpenAI, costruito specificamente per una funzione molto precisa: l’inferenza.

Loading...

Cosa è l’inferenza?

Tradotto dal gergo tecnico: non serve ad addestrare i modelli, ma a farli lavorare. È la differenza tra costruire un cervello e usarlo. L’addestramento è la fase in cui un modello consuma quantità gigantesche di dati e potenza computazionale per imparare. L’inferenza, invece, è ciò che succede ogni volta che un utente scrive una domanda su ChatGPT, chiede a Codex di generare codice o attiva un agente AI.

Il problema: l’AI costa troppo

Ecco perché l’inferenza è diventata fondamentale nella nuova economia degli agenti intelligenti. Negli ultimi due anni il collo di bottiglia dell’intelligenza artificiale è rappresentato dall’hardware, o meglio dai costi per fornire potenza di calcolo sufficiente per fare lavorare le reti neurali. I server costano, l’energia elettrica costa, serve controllare il processo. OpenAI, come quasi tutti, è cresciuta appoggiandosi all’infrastruttura di Microsoft e ai chip Nvidia. Ma c’è un problema strutturale: più cresce ChatGPT, più cresce la bolletta computazionale. Per questo OpenAI ha scelto di spostarsi verso un modello “full stack”: controllare non solo i modelli e i prodotti, ma anche il silicio sottostante. Jalapeño nasce dentro questa strategia.

Perché l’inferenza conta più del training

Il training è costosissimo, ma avviene periodicamente. L’inferenza invece è continua. È industriale. È quotidiana. È la fabbrica che resta aperta 24 ore su 24. Con milioni — presto miliardi — di utenti che interrogano modelli AI ogni giorno, l’inferenza è diventata il vero centro di costo. E anche il vero centro del potere. OpenAI sostiene che Jalapeño offra performance per watt superiori rispetto ai chip attualmente sul mercato. Se confermato, significa una sola cosa: più richieste elaborate con meno energia. In un business dove ogni millisecondo e ogni watt contano, è un vantaggio enorme.

Perché tutte le Big Tech fanno chip

OpenAI non è un’eccezione. È solo arrivata più tardi. Le Big Tech hanno capito una cosa fondamentale: nell’era AI non basta possedere il software. Bisogna possedere anche la macchina. Google lo ha capito prima di tutti con le TPU (Tensor Processing Units). Oggi sono il motore invisibile di Gemini e di gran parte dell’infrastruttura AI di Alphabet. Microsoft sta spingendo con i chip Maia, pensati per alleggerire la dipendenza da Nvidia nei datacenter Azure. Amazon ha sviluppato Trainium e Inferentia, con una divisione chiara: training da una parte, inferenza dall’altra. Meta lavora da tempo su acceleratori custom per Llama. E persino Nvidia, dominatrice del mercato, si sta spostando sempre di più verso architetture pensate per carichi inferenziali, perché ha capito dove andrà la domanda.

OpenAI non vuole più essere soltanto un laboratorio di AI o una software company. Vuole diventare una infrastruttura tecnologica completa. Un po’ come Apple, che anni fa capì che progettare i propri chip significava costruire vantaggio competitivo duraturo. La differenza è che qui non si parla di smartphone, ma della nuova infrastruttura cognitiva globale.

Riproduzione riservata ©
  • Luca Tremolada

    Luca TremoladaGiornalista

    Luogo: Milano via Monte Rosa 91

    Lingue parlate: Inglese, Francese

    Argomenti: Tecnologia, scienza, finanza, startup, dati

    Premi: Premio Gabriele Lanfredini sull’informazione; Premio giornalistico State Street, categoria "Innovation"; DStars 2019, categoria journalism

Loading...

Brand connect

Loading...

Newsletter

Notizie e approfondimenti sugli avvenimenti politici, economici e finanziari.

Iscriviti