La ricerca scientifica richiede ecosistemi IT complessi, necessari per l’elaborazione dei dati, ed è caratterizzata da una forte interdisciplinarità che va indirizzata tenendo alta la sensibilità verso soluzioni intrinsecamente collaborative. Studi ad alta intensità di calcolo come quelli per il cambiamento climatico, le biodiversità, la scienza dei materiali, richiedono infrastrutture digitali capaci di sostenere carichi computazionali elevati, garantire la riproducibilità dei risultati e favorire la cooperazione tra ricercatori distribuiti a livello internazionale. È lo scenario entro cui opera D4Science.

Il contesto

D4Science è l’infrastruttura digitale gestita dal Consiglio Nazionale delle Ricerche (Cnr), progettata per supportare i processi di ricerca collaborativa e data-intensive. Nasce con l’obiettivo di abbattere le barriere tecnologiche che possono ostacolare l’accesso alle risorse di calcolo, agli strumenti di analisi e ai dati, mettendo a disposizione della comunità scientifica ecosistemi digitali avanzati per la condivisione della conoscenza. Il modello su cui si fonda è quello della Science as a Service, in cui la tecnologia diventa un abilitatore dell’attività scientifica, consentendo ai ricercatori di concentrarsi sui risultati piuttosto che sulla complessità infrastrutturale. Nel corso degli anni, D4Science si è affermata come piattaforma di riferimento per diverse comunità scientifiche, arrivando a supportare oltre 28mila ricercatori in più di 70 Paesi.

La sua architettura è pensata per ospitare Virtual Research Environments, ovvero ambienti di lavoro digitali che integrano strumenti, dati e servizi specifici per dominio scientifico, favorendo un approccio collaborativo e riproducibile alla ricerca. Questo posizionamento rende D4Science non solo un fornitore di infrastruttura, ma un vero e proprio facilitatore della trasformazione digitale della scienza. La crescita costante della comunità e l’evoluzione delle metodologie di ricerca hanno però posto nuove sfide. L’adozione sempre più diffusa di tecniche di intelligenza artificiale e machine learning, insieme alla necessità di analizzare dataset di dimensioni crescenti, ha reso evidente la necessità di ripensare l’architettura tecnologica sottostante, mantenendo al contempo un forte presidio sulla governance e sulla sovranità dei dati.

Il bisogno e il metodo

L’infrastruttura storica di D4Science, basata prevalentemente su sistemi on-premise, ha garantito per anni stabilità e controllo, ma inizia a mostrare limiti strutturali in presenza di carichi di lavoro variabili e picchi improvvisi di domanda. Attività come il training di modelli di intelligenza artificiale o la pubblicazione urgente di risultati scientifici richiedono infatti una capacità di calcolo elastica, difficilmente sostenibile con un approccio tradizionale basato su risorse fisse. Il bisogno emerge duplice. Da un lato, D4Science deve continuare a garantire un elevato livello di affidabilità, sicurezza e conformità normativa, elementi imprescindibili per una infrastruttura di ricerca pubblica operante a livello internazionale. Dall’altro, è necessario introdurre maggiore flessibilità e scalabilità, per rispondere in modo dinamico alle esigenze delle comunità scientifiche supportate.

In questo contesto si colloca la scelta di evolvere verso un’architettura ibrida, in cui i sistemi on-premise, con il nuovo data center di Pisa come asset centrale di stabilità, vengono affiancati dalle capacità del cloud. Google Cloud è individuato come partner tecnologico per supportare questa trasformazione, mettendo a disposizione un insieme di servizi in grado di integrarsi con l’infrastruttura esistente e di estenderne le capacità in modo controllato. Il ruolo di Google Cloud non è quindi quello di sostituire l’infrastruttura esistente, ma di potenziarla, offrendo un livello di elasticità e potenza di calcolo indispensabili per sostenere l’evoluzione della ricerca data-intensive. La possibilità di allocare risorse in tempo reale, in funzione delle necessità dei ricercatori, rappresenta un elemento chiave per un modello di Science as a Service che deve essere al tempo stesso sostenibile e scalabile.

Le soluzioni

L’architettura definita da D4Science si basa su un modello ibrido che integra servizi cloud gestiti di Google Cloud con i sistemi locali. In questo contesto, tecnologie come Google Kubernetes Engine, Compute Engine e Vertex AI svolgono un ruolo centrale nel supportare l’operatività quotidiana della piattaforma.

Pasquale Pagano
Pasquale Pagano, executive director di D4Science 

Attraverso questi servizi, D4Science gestisce oggi 238 Virtual Research Environments attivi, che ospitano strumenti di lavoro fondamentali per la comunità scientifica, come JupyterLab, RStudio e applicazioni dedicate all’analisi dei dati. Gli ambienti virtuali consentono ai ricercatori di collaborare in modo continuo, condividendo codice, dati e risultati all’interno di contesti digitali coerenti e riproducibili.

L’utilizzo di un’infrastruttura cloud-native permette di superare i silos tecnologici tra le diverse discipline scientifiche, favorendo un approccio trasversale alla ricerca e riducendo i tempi necessari per il provisioning delle risorse. Un elemento particolarmente rilevante è l’integrazione di Vertex AI, che ha consentito a D4Science di democratizzare l’accesso agli strumenti di intelligenza artificiale.
Attraverso lo sviluppo di interfacce conversazionali e funzionalità di ricerca semantica, la piattaforma rende possibile l’utilizzo dell’AI anche da parte di ricercatori che non dispongono di competenze avanzate di programmazione. Questo approccio consente agli scienziati di concentrarsi sugli obiettivi scientifici, riducendo la complessità tecnologica sottostante.

Spiega Pasquale Pagano, executive director di D4Science: “Il nostro obiettivo è democratizzare l’accesso all’intelligenza artificiale e alle tecnologie avanzate, promuovendole come un modello di ricerca basato sulla collaborazione e sulla riproducibilità e rendendole realmente alla portata della comunità scientifica”.

Raffaele Gigantino
Raffaele Gigantino, country manager Italy di Google Cloud

La scelta di Google Cloud si inserisce in questa visione, offrendo la possibilità di gestire in modo sicuro la residenza dei dati, integrarsi con i sistemi esistenti e operare in un contesto attento alla sostenibilità. Il progetto rappresenta poi un esempio concreto di come le architetture ibride e l’intelligenza artificiale possano incidere direttamente sull’accelerazione della ricerca scientifica. E il punto di vista di Google Cloud, espresso da Raffaele Gigantino, country manager Italy di Google Cloud, rimarca che “il progetto realizzato con D4Science dimostra come l’intelligenza artificiale e le architetture cloud ibride possano accelerare in modo concreto la ricerca scientifica e rafforzare la collaborazione tra ricercatori a livello globale”.

I vantaggi

La tecnologia diventa allora un alleato operativo dell’innovazione scientifica, più che un semplice supporto infrastrutturale. Un ulteriore aspetto centrale riguarda la sicurezza e la governance dei dati. In un contesto di ricerca internazionale, la gestione della sovranità dei dati è un tema prioritario. L’architettura ibrida consente a D4Science di mantenere i dati sensibili su sistemi locali cifrati, utilizzando il cloud per l’elaborazione di dataset pubblici o anonimizzati. Per le realtà operanti sul territorio italiano, l’utilizzo delle region Google Cloud di Milano e Torino garantisce bassa latenza e conformità alle normative europee, in particolare al Gdpr, sostenendo al contempo gli obiettivi di sostenibilità del Cnr.
La scelta porta però anche una serie di benefici misurabili che si riflettono direttamente sull’efficienza dei processi di ricerca. Negli ultimi 15 mesi, D4Science ha registrato una riduzione dell’80% dei tempi di training dei modelli di intelligenza artificiale, un risultato che incide in modo significativo sulla velocità con cui i ricercatori possono sperimentare, validare e iterare le proprie soluzioni. L’incremento del 275% nell’utilizzo di JupyterLab testimonia una maggiore diffusione degli strumenti di analisi avanzata, resa possibile da un’infrastruttura più reattiva e accessibile.
Allo stesso tempo, la crescita del 15% degli utenti registrati evidenzia come la maggiore rapidità di provisioning abbia abbassato le barriere di ingresso, ampliando la base di ricercatori che possono beneficiare dei servizi offerti dalla piattaforma. Un altro indicatore rilevante è il raddoppio delle sessioni medie mensili di lavoro nei Virtual Research Environments, passate da 5.340 a 10.758. Questo dato riflette un utilizzo più intensivo e continuativo degli ambienti digitali messi a disposizione, segnale di una integrazione sempre più profonda della piattaforma nei flussi di lavoro quotidiani delle comunità scientifiche.
Dal punto di vista strategico, infine, l’adozione di un’architettura ibrida e scalabile consente a D4Science di sostenere la propria partecipazione a progetti e finanziamenti europei, offrendo garanzie in termini di sicurezza, conformità e sostenibilità. La possibilità di combinare controllo locale e flessibilità cloud rappresenta un fattore abilitante per una ricerca più aperta, collaborativa e riproducibile.

© RIPRODUZIONE RISERVATA

Condividi l'articolo: