La Guerra Fredda dell'AI (#93)


SONG OF THE WEEK: Cold War – Janelle Monáe

Non so voi, ma negli ultimi mesi mi sembra di essere tornato indietro nel tempo. Le notizie parlano di guerra fredda, di controllo delle esportazioni, di supremazia tecnologica. L’unica differenza? Al posto delle testate nucleari abbiamo i modelli di AI. E al posto della corsa allo spazio abbiamo la corsa ai mega-cluster di GPU.

Finirà meglio o peggio?

Il DeepSeek moment

Partiamo da un dato: lo scorso 27 Gennaio 2025, per la prima volta nella storia dell’AI, il modello più avanzato al mondo non parlava inglese come prima lingua. Sì, perché DeepSeek, l’azienda cinese che ha fatto tremare Silicon Valley, ha dimostrato che si può costruire un modello all’avanguardia spendendo “solo” 5 milioni di dollari (per l’addestramento eh). Per capirci, è come se qualcuno avesse costruito una Ferrari con il budget di una Panda.

Ma non è solo una questione di soldi. È una questione di approccio. Mentre in Occidente ci preoccupiamo (giustamente) di alignment, safety e regolamentazione, in Cina si punta dritto all’obiettivo: “ship or die“, come direbbero a San Francisco.

Ricordate quando nel 2022 Sam Altman twittava che “l’AI è americana come l’apple pie“? Beh, qualcuno dovrebbe dirgli che ora anche il dim sum è entrato nel menu.

Non è solo DeepSeek. ByteDance (sì, quelli di TikTok) ha più di 500.000 GPU sparse per il mondo. Baidu sta costruendo il suo mega-cluster. E tutto questo nonostante le restrizioni USA sull’esportazione di chip.

Come ci sono riusciti?

Non contano le dimensioni… quasi

Un mix di tre ingredienti: ingegnerizzazione estrema (la loro implementazione di MLA, Multi-head Latent Attention, è qualcosa di geniale), una cultura del “build fast, break things” che la Silicon Valley ha un po’ dimenticato, e sì, anche qualche GPU di “provenienza incerta” (ma questa è un’altra storia…).

Ad ogni modo quello che è successo a gennaio 2025 non è solo una questione di tecnologia. È un cambio di paradigma. Per la prima volta, un modello open source (R1) ha battuto i giganti proprietari sul loro stesso terreno. E l’ha fatto con un budget che per aziende come OpenAI o Anthropic è quello che spendono in caffè per i dipendenti.

Come dice sempre un mio amico CTO: “Non è la dimensione del modello che conta, ma come lo usi“. E DeepSeek lo ha dimostrato: con la giusta architettura e un po’ di ingegno, si possono ottenere risultati straordinari anche senza spendere miliardi.

La nuova corsa all’oro

Facciamo un gioco: indovinate quanto costa costruire un cluster AI di ultima generazione? No, di più. Di più ancora.

OpenAI con il progetto Stargate parla di 100 miliardi di dollari. Meta sta costruendo due centrali a gas naturale in Louisiana solo per alimentare i suoi server. Elon? Ha comprato una vecchia fabbrica a Memphis, l’ha riempita di GPU e ora sta costruendo una centrale elettrica dedicata.

Quando si parla di futuro dell’AI, tutti pensano ad AGI, superintelligenza e robot che ci portano il caffè a letto. Ma la realtà, come sempre, è molto più interessante. Insomma dopo queste ultime settimane convulse le conclusioni che mi sento di dare sono 3:

  1. La “democratizzazione dell’AIè un’illusione ottica. Non sarà come internet dove “chiunque può creare un sito web”. Sarà più simile al cloud computing: sì, tutti possono accedere ad AWS, ma quanti possono davvero permettersi di scalare? La vera domanda non sarà “chi può usare l’AI”, ma “chi può permettersi di usarla in modo significativo”.

Esempio concreto? Già oggi vediamo startup che spendono più in API di OpenAI che in stipendi. E non parlo di piccole cifre: conosco personalmente un founder che spende 200k al mese solo per far girare il suo chatbot customer service. La democratizzazione? Sì, ma con il portafoglio giusto.

  1. I modelli saranno commodities, ma non è questa la vera partita. È come quando tutti dicevano che il cloud avrebbe reso irrilevante l’hardware. Sapete chi è la company con la più alta capitalizzazione di mercato oggi? NVIDIA. Perché? Perché non conta solo avere accesso alla tecnologia, conta come la usi.

Il vero game changer non sarà avere il modello migliore, ma capire come integrarlo nei processi aziendali. È come Netflix: non ha vinto perché aveva i server migliori, ma perché ha capito come usare la tecnologia per cambiare completamente un’industria.

  1. La vera rivoluzione? È culturale, non tecnologica. Questo è il punto più controverso, ma sono pronto a difenderlo: torniamo sempre li ovvero la vera differenza la farà chi riuscirà a fare le domande giuste, non chi avrà le risposte migliori.

Pensateci: DeepSeek non ha vinto perché aveva più risorse o tecnologia migliore. Ha vinto perché ha fatto una domanda diversa: “Come possiamo fare di più con meno?”. Mentre in Occidente ci concentravamo su “come rendere i modelli più grandi”, loro si chiedevano “come renderli più efficienti”.

È qui che la diversità culturale diventa un super-potere. Immaginate quando avremo modelli che incorporano modi di pensare completamente diversi dal nostro. Non parlo solo di Est vs Ovest, ma di prospettive completamente diverse sul mondo. È come avere Einstein, Confucio e Steve Jobs che collaborano allo stesso progetto.

E sapete qual è la parte più divertente? Mentre noi dibattiamo su quale sarà il futuro dell’AI, il futuro sta già accadendo (citazione colta di William Gibson) e soprattutto, non assomiglia per niente a quello che ci aspettavamo.

Sempre avanti, condannati all’ottimismo!

Giuseppe