La domanda di risorse digitali generata dall’intelligenza artificiale non è più da considerare come una variabile congiunturale e presenta oramai tutti i tratti di un fattore strutturale. Per l’industria IT, nel suo complesso, la transizione, maturata nell’arco di pochi trimestri, esercita oggi una pressione asimmetrica su tutti i livelli della supply chain tecnologica: i prezzi della memoria si impennano, l’architettura dei modelli considerati “piccoli” ha cambiato scala, e con la maturazione degli agenti è necessario ricalibrare il mix di risorse di calcolo necessarie, per cui le reti dei provider faticano a tenere il passo. Come se non bastasse l’orizzonte normativo, in particolare quello relativo alla sovranità del dato, resta frammentato. Quattro fronti aperti contemporaneamente che, letti insieme, non descrivono un singolo problema ma un sistema in cui ogni anello è chiamato a riposizionarsi, sotto pressione, e deve farlo in relazione agli altri. 

Spesa per memorie e silicio, le anomalie

Il primo segnale arriva dal mercato dei semiconduttori. L’analisi di Omdia relativa alle previsioni sul mercato dei semiconduttori per il 2026 evidenzia come l’intelligenza artificiale alimenti da una parte la crisi globale sullo shortage delle memorie, dall’altra una previsione di crescita dei ricavi sui semiconduttori per l’anno in corso al 62,7%. Un dato che, di per sé, segnerebbe già un’anomalia storica. Ma il vero elemento da leggere sta nella composizione: il mercato Dram è atteso quasi raddoppiare il proprio valore, mentre il segmento Nand, di dimensioni inferiori, potrebbe quadruplicare rispetto al 2025. Una dinamica che, per scala e ampiezza, non ha precedenti a memoria.

Myson Robles-Bruce
Myson Robles-Bruce, senior principal analyst, Omdia

A spiegarne le ragioni è Myson Robles-Bruce, senior principal analyst della società di analisi, secondo cui “l’evoluzione dell’AI ha aumentato esponenzialmente la domanda di memoria e processing”, alimentando i ricavi complessivi del settore, ma questo porta a riconoscere anche che dietro l’impennata si muove un fattore strutturale: “La priorità data dalla filiera alla High Bandwidth Memory (Hbm), che produce volumi inferiori ma genera prezzi nettamente più alti”, fenomeno che drena le capacità dalla memoria convenzionale e prolunga il deficit di offerta. Un sollievo significativo non sarebbe atteso in questa direzione prima del 2027 inoltrato. A sostenere la pressione contribuiscono anche il ciclo di refresh dei server enterprise, che entra in fase espansiva nel 2026, e i livelli di capex degli hyperscaler, descritti come “eccezionali”. Il tessuto consumer non rappresenta un sostegno minore: pur restando le spedizioni di smartphone sostanzialmente stabili, l’aumento dei prezzi della memoria fa lievitare il conto finale della spesa per i materiali, mentre nuovi flagship pieghevoli, modelli con funzioni AI avanzate per la fotografia, smartwatch e wearable concorrono a sostenere i ricavi. La cautela strategica di Omdia riguarda però un punto delicato: la crescita è oggi spinta soprattutto dai prezzi medi più che dai volumi unitari, una condizione che richiama precedenti cicli speculativi — dal mining cripto ai memory super cycle — ma con scala e ampiezza senza precedenti.

Semiconduttori, le previsioni sui ricavi per il 2026
Semiconduttori, le previsioni sui ricavi per il 2026 (fonte: Omdia, 2026)

Modelli AI cambiano le esigenze infrastrutturali

Mentre la base hardware accelera la crescita, l’architettura dei modelli si riorganizza. Emerge come la crescita dei parametri dei modelli di frontiera sia scesa intorno al 5% annuo dal 2021, a fronte di un’espansione superiore anche di 100 volte registrata tra il 2019 e il 2021. Una decelerazione marcata, che però — come precisa Omdia nel report AI Model Trends Spring 2026 — non rappresenta affatto una nuova gelata per l’intelligenza artificiale come quelle vissute negli anni Ottanta. “La diffusione degli agenti sta guidando questo cambiamento – sintetizza Alexander Harrowell, senior principal analyst per l’Advanced Computing di Omdia -.

Alexander Harrowell, senior principal analyst per l’Advanced Computing di Omdia_DEF
Alexander Harrowell, senior principal analyst per l’Advanced Computing di Omdia

I sistemi AI moderni traggono migliori prestazioni dal tool use, scambiando di fatto Cpu di computing relativamente economiche con risorse Gpu più costose. La conseguenza è un rapporto Cpu:Gpu che tende a portarsi verso 1:1, contro un equilibrio storicamente molto più sbilanciato sulla Cpu.

In parallelo si sta riposizionando anche la categoria dei modelli “piccoli”: mentre fino a poco tempo fa si consideravano tali quelli da 100 milioni di parametri, oggi si affermano nella categoria modelli da 7-14 miliardi, mentre una nuova fascia midsize open source guadagna trazione su sviluppo, sentiment e adozione. Le ricadute infrastrutturali sono molteplici. Cresce la domanda di “context window” estese (è la quantità massima di testo – misurata in token – che il modello può elaborare, Ndr.), perché tutti gli input, le interazioni e le comunicazioni con gli strumenti vi transitano; emerge una nuova gerarchia di cache che spazia dalla memoria allo storage veloce per gestire l’offload del contesto; tornano interessanti i mid-range Gpu come Nvidia B40, mentre le Gpu degli anni precedenti mantengono valore residuo come opzione cost-effective per inferenza di modelli piccoli e medi e per architetture di inferenza disaggregate. Un mix che, sostiene Omdia, è destinato a esercitare una pressione crescente proprio sulle reti dei data center — ed è esattamente lì che si apre il fronte successivo.

Neocloud, il collo di bottiglia è la rete

Lo strato infrastrutturale dei provider specializzati nella fornitura di risorse legate alle Gpu (e quindi di cloud per l’intelligenza artificiale), i cosiddetti neocloud provider, sta accusando il colpo di questa evoluzione nella domanda. L’audit condotto da Omdia su 50 operatori mostra una situazione asimmetrica: la potenza di calcolo è stata scalata aggressivamente, ma il networking sta diventando un vincolo critico. Le performance dell’AI dipendono sempre più dalla capacità di processare e spostare i dati in modo sicuro attraverso ambienti distribuiti e geografie diverse. “L’infrastruttura di rete farà il successo dei neocloud o ne determinerà il fallimento -, sottolinea Camille Mendler, research director Telco b2b di Omdia -. Perché connettività a bassa latenza, resiliente e sicura, dal backbone all’edge, è oggi prerequisito di base, non più elemento differenziante”.

Camille Mendler Camille Mendler, research director Telco b2b di Omdia
Camille Mendler, research director Telco b2b di Omdia

Cinque sono le aree di rischio che le imprese dovrebbero verificare prima di selezionare un fornitore di capacità AI. La prima riguarda le competenze interne: il 43% dei neocloud sta cercando attivamente network engineer e specialisti di sicurezza per colmare carenze ritenute urgenti. La seconda è l’accountability contrattuale: oltre un terzo dei provider minimizza la responsabilità su uptime, sicurezza e sovranità dei dati. La terza riguarda gli “on-ramp” verso le altre cloud: più della metà degli operatori non utilizza Internet peering exchange, con effetti sulla coerenza delle prestazioni. La quarta interessa gli asset IP: il 46% controlla solo piccoli blocchi di indirizzi IPv4, limitando crescita, localizzazione del traffico e controllo del routing. La quinta è la resilienza del transito IP: un neocloud su cinque dipende da un singolo provider, esponendosi a un single point of failure. A questo si aggiunge l’eterogeneità delle origini dei neocloud — dal bitcoin mining alla content distribution, fino al Web hosting — che spiega perché le loro capacità di rete varino da rudimentali ad avanzate. Mendler stessa richiama un punto nevralgico: “La sovranità del dato si estende ovunque si muovano i workload di intelligenza artificiale. Un’osservazione che fa da ponte naturale all’ultimo livello su cui si scaricano le tensioni”.

Come i modelli AI mettono sotto pressione le reti
Come i modelli AI mettono sotto pressione le reti (fonte: Neoclouds Not Ready for AI Networking, Omdia, 2026)

Sovranità del dato, manca una definizione comune

Ultimo, ma non ultimo, l’attenzione al dato, cresciuta grazie al potenziale delle AI, porta sotto la lente anche il piano regolatorio in un quadro altrettanto denso. Più di cento Paesi hanno introdotto qualche forma di norma su sovranità o localizzazione dei dati, ma la disomogeneità delle definizioni e degli ambiti rende l’orizzonte di compliance,  sempre più difficile da governare. L’Unione Europea, con lEuropean Cloud Sovereignty Framework annunciato nell’ottobre 2025, ha provato a fissare un blueprint replicabile, di cui una componente specifica è dedicata proprio alla sovranità del dato. Ma la spinta non è solo europea: anche India, Vietnam e Indonesia stanno seguendo strade analoghe, ciascuno con propri criteri e perimetri.

Sarah McBride
Sarah McBride, principal analyst Regulation di Omdia

“Non esiste però una definizione universalmente accettata, e questo rende la compliance complessa – spiega Sarah McBride, principal analyst Regulation di Omdia -. La conseguenza è una frammentazione crescente dei framework regolatori a livello mondiale”. Alla quale si aggiunge un secondo livello di complessità: spesso, anche all’interno di uno stesso Paese, la sovranità del dato non è disciplinata da una norma unica ma da più leggi sovrapposte. Le imprese si trovano così a confrontarsi con regole eterogenee, e talvolta in contraddizione, su protezione dei dati, localizzazione e flussi cross-border.
Le ricadute operative sono concrete: garantire la sovranità del dato impone alle imprese di formare i dipendenti sulle normative pertinenti, riprogettare le tecnologie, assumere personale specializzato e implementare nuovi processi. Per le organizzazioni multinazionali, lo scenario si traduce in costi di compliance crescenti e in una complessità operativa difficile da assorbire, soprattutto laddove l’adozione dell’intelligenza artificiale richiede di muovere dati attraverso più giurisdizioni quasi in tempo reale.
Il quadro che emerge è quello di un’industria AI che cresce sotto domande in espansione ma su fondamenta non sincronizzate. Il silicio costa di più, i modelli si frammentano in agenti che caricano Cpu e reti, i provider di Gpu non hanno ancora le reti all’altezza, le regole sui dati cambiano da Paese a Paese e talvolta da legge a legge. Ogni livello chiede un riposizionamento agli altri, e nessuno, oggi, può permettersi di attendere che siano gli altri a muoversi per primi.

© RIPRODUZIONE RISERVATA

Condividi l'articolo: