Home Tecnologie McKinsey, evoluzione neocloud per i workload AI

Neocloud McKinseyImmagine di vecstock su Freepik

Tecnologie

McKinsey, evoluzione neocloud per i workload AI

La crescita della domanda di risorse ai provider neocloud nasce dalla scarsità globale di Gpu per l'AI. Modello economico ancora fragile e confronto con gli hyperscaler definiscono l'andamento del mercato e indirizzano le strategie. L'analisi McKinsey

Mario De Ascentiis

02.12.2025

112

Intelligenza artificiale generativa e modelli di deep learning hanno portato il mercato globale del calcolo ad alte prestazioni ad evolvere in tempi rapidi. La possibilità di utilizzare Gpu avanzate, componenti critiche per addestrare e servire i modelli complessi, è diventata però uno dei principali vincoli strutturali allo sviluppo dell’AI. La scarsa disponibilità ha favorito l’emergere di una nuova categoria di provider: i neocloud provider, che offrono Gpu-as-a-Service e risorse specificamente dedicate all’AI e al Hpc e si propongono come alternativa ai grandi hyperscaler.
McKinsey, nello studio The Evolution of Neoclouds and Their Next Moves, analizza l’evoluzione di questo mercato e ne delinea le traiettorie possibili nel medio-lungo periodo. Secondo gli analisti, i neocloud provider nascono proprio come risposta immediata alla scarsità infrastrutturale, ma la sostenibilità delo loro business dipende dalla capacità di ripensare il proprio modello economico e crescere nella proposizione di tutto lo stack tecnologico. Il concetto neocloud identifica infatti provider che, pur partendo da un’offerta di Bare-Metal-as-a-Service (BMaaS), cercano di costruire servizi nativi di AI e configurazioni specializzate, con l’obiettivo di fidelizzare startup e imprese che necessitano di accesso rapido e flessibile a Gpu avanzate.

I vantaggi dei neocloud e il mercato

I neocloud si sono affermati grazie a modelli contrattuali flessibili, tempi di provisioning rapidi e infrastrutture ottimizzate per il training di modelli AI complessi, caratteristiche che li rendono particolarmente competitivi su nicchie specifiche rispetto agli hyperscaler tradizionali. Il report McKinsey aggiunge un dato cruciale: i neocloud offrono prezzi fino all’85% inferiori rispetto ai cloud provider globali, un vantaggio determinante per le startup che devono ottimizzare il consumo di risorse computazionali.
La ridotta barriera tecnica d’ingresso – non è necessario costruire un full stack tech come quella delle piattaforme hyperscale – consente a diversi operatori di entrare rapidamente nel mercato. Oggi ne esistono oltre cento nel mondo, con una concentrazione particolare tra Stati Uniti, Europa, Medio Oriente e Asia. Questa proliferazione è alimentata anche da venture capital, private equity e fondi sovrani, oltre che da strategie deliberate dei produttori di chip che utilizzano i neocloud come canale per diversificare la distribuzione delle proprie Gpu.
Alla base della crescita c’è una dinamica di mercato duale: da un lato la domanda di calcolo AI cresce in modo esplosivo; dall’altro gli hyperscaler assorbono volumi enormi di Gpu avanzate, lasciando scoperti segmenti di mercato che i neocloud sono pronti a servire con formule più rapide e più economiche.

Il ruolo dei neocloud provider nelle economie AI

I neocloud provider hanno iniziato l’attività proponendo servizi di BMaaS, offrendo Gpu in modalità bare-metal con un pricing standardizzato e competitive time-to-value. Tuttavia, questa prima generazione di offerta si sta rivelando insostenibile nel lungo periodo. Il report McKinsey conferma che il modello BMaaS presenta margini lordi compresi tra il 55% e il 65% prima dell’ammortamento, ma con un margine di sicurezza estremamente ridotto: basta un calo dei prezzi di noleggio o dell’utilizzo sotto l’80% perché la redditività scompaia completamente. Il capitale richiesto per acquistare Gpu di ultima generazione rende il modello altamente debole se si tratta di seguire i cicli tecnologici. Ogni nuovo chip immesso sul mercato determina un rapido deprezzamento delle generazioni precedenti, tanto che McKinsey evidenzia come, in un arco di cinque anni, il costo orario di una Gpu possa scendere fino alla metà del prezzo iniziale (vedi chart qui di seguito). Ciò impone ai provider un continuo reinvestimento e una rotazione frequente delle flotte, aumentando la pressione finanziaria.

Andamento del prezzo delle Gpu dopo il lancio, per anno (fonte: The Evolution of Neoclouds and Their Next Moves, McKinsey, 2025)

A questo si aggiunge il fatto che i contratti su larga scala – soprattutto quelli stipulati con gli hyperscaler per assicurarsi capacità immediatamente disponibile – sono molto meno redditizi di quanto appaia. Dopo costi energetici, lavoro e ammortamenti, i margini effettivi oscillano tra il 14% e il 16%. Tuttavia, questi accordi rappresentano per i neocloud un vantaggio competitivo in termini di credibilità e garantiscono un baseline di utilizzo, che risulta essenziale per sostenere i finanziamenti e la crescita. La ricerca mette inoltre in evidenza come molti operatori dipendano da pochi clienti: per alcuni, più della metà dei ricavi deriva da uno o due soli hyperscaler, con rischi significativi di concentrazione.

Il paradosso strutturale, crescere senza competere con gli hyperscaler

Gli investitori ritengono il BMaaS solo una fase iniziale e considerino inevitabile la transizione verso servizi nativi di AI. Questa analisi viene approfondita nel report McKinsey che introduce un vero e proprio paradosso: per aumentare marginalità ed evitare l’erosione dei prezzi, i neocloud provider devono risalire lungo lo stack tecnologico, sviluppando anche piattaforme di orchestrazione, inferenza distribuita, stack verticali settoriali e strumenti per sviluppatori. Ma questo li porta a sovrapporsi agli hyperscaler, che sono allo stesso tempo i loro più importanti clienti per i contratti di offtake.
Costruire una tecnologia sufficientemente robusta per competere nella parte alta della stack richiede ingenti investimenti, tempo e competenze. Inoltre, intercettare il mercato enterprise implica l’adozione di strategie commerciali mature, che molti neocloud non hanno ancora sviluppato. Da qui deriva un conflitto strategico: differenziarsi è necessario per la sopravvivenza, ma farlo può alienare gli stessi hyperscaler che garantiscono l’utilizzo minimo dell’infrastruttura. Secondo McKinsey, questo equilibrio instabile ricorda da vicino il percorso delle startup del cloud 1.0, molte delle quali vennero assorbite da player più grandi o costrette a specializzarsi in nicchie molto definite.

Investimenti neocloud, 4 elementi chiave e 3 trend

Sono quattro le direttrici che stanno guidando gli investitori e che evidenziano come il neocloud si trovi in un momento di passaggio cruciale. Queste direttrici, tuttavia, possono essere lette sia come fondamenta sia come elementi di rischio:

Il BMaaS è solo un punto di partenza, non il punto di arrivo.
Perché il modello diventi sostenibile deve trasformarsi in una piattaforma software nativa di AI, capace di creare fidelizzazione e retention.
La domanda di compute AI ha dinamiche troppo forti per essere ignorata.
Gli analisti stimano un fabbisogno di circa 200 gigawatt entro il 2030, con la capacità infrastrutturale come principale collo di bottiglia.
Le risorse per il calcolo ammortizzate mantengono valore nel lungo periodo.
Possono essere riutilizzate per workload non di ultima generazione, contribuendo a estendere la vita economica degli asset.
I produttori di chip svolgono una funzione di derisking.
Allocazioni preferenziali, formule di finanziamento e impegni di acquisto aumentano la resilienza del modello.

Questi elementi, tuttavia, non eliminano la fragilità del BMaaS, né risolvono il paradosso competitivo di lungo periodo.
Da qui tre possibili traiettorie per il neocloud nei prossimi anni. Le evidenziamo.

Specializzazione in nicchie difendibili: I neocloud che sapranno costruire un vantaggio competitivo in segmenti dove gli hyperscaler sono meno efficaci – come il computing sovrano o servizi per workload ultra specializzati – avranno maggiori probabilità di sostenibilità. Il sovrano compute, legato alla gestione di dati sensibili e contesti iperlocali, rappresenta uno degli spazi più promettenti.

Partnership con startup AI e crescita con il loro successo: Molte startup di AI non possono permettersi i costi degli hyperscaler nelle prime fasi di sviluppo. Offrire loro capacità di calcolo flessibile e accessibile consente ai neocloud di instaurare relazioni che possono proseguire quando le startup diventano piattaforme da miliardi di dollari, con esigenze di workload massivi. Questa fidelizzazione sarebbe difficile da replicare per gli hyperscaler.

Consolidamento del mercato: Come successo con il cloud 1.0, alcuni operatori verranno assorbiti da hyperscaler, telco o fondi sovrani. Altri potrebbero uscire dal mercato man mano che l’offerta infrastrutturale degli hyperscaler cresce fino a colmare la domanda. Il consolidamento, secondo McKinsey, è già visibile e rappresenta una traiettoria naturale in un settore con economie di scala così complesse.

Il neocloud rappresenta un anello di congiunzione tra l’economia dell’AI e la capacità infrastrutturale globale. Nato come segmento spinto dall’urgenza e da una domanda senza precedenti, la sostenibilità del modello richiede oggi però una trasformazione profonda: salire nella stack tecnologica senza entrare in conflitto con gli hyperscaler, trovare nicchie difendibili, costruire relazioni strategiche con startup AI e riuscire a gestire la complessità economica di un mercato dominato da cicli rapidi di innovazione. Il futuro del neocloud dipende quindi dalla capacità dei provider di trasformare una “scarsità di risorse” temporanea in un vantaggio competitivo duraturo, consolidando un nuovo strato nell’infrastruttura globale dell’intelligenza artificiale.

Condividi l'articolo:

I vantaggi dei neocloud e il mercato

Il ruolo dei neocloud provider nelle economie AI

Il paradosso strutturale, crescere senza competere con gli hyperscaler

Investimenti neocloud, 4 elementi chiave e 3 trend

DI TENDENZA

SCELTO DALLA REDAZIONE

ARTICOLI POPOLARI