Prodotti biofarmaceutici e primary care sono gli ambiti che contraddistinguono l’attività di Dompé farmaceutici che opera da circa 130 anni nell’ambito dell’innovazione medica ed ha mosso i primi passi come laboratorio di produzione farmaceutica a Milano. Oggi impiega più di 800 dipendenti in tutto il mondo (772 i milioni di fatturato nel 2022) e conta un hub per le operazioni commerciali negli Stati Uniti nella San Francisco Bay Area, ma è anche presente a Boston.

Il contesto ed il bisogno

E’ riconosciuto come i sistemi di supercalcolo siano fondamentali per il comparto biomedico e la ricerca sulle nuove molecole dei farmaci. Dompé sente l’esigenza di costruire un sistema in grado di immagazzinare e gestire le enormi quantità di informazioni indispensabili a rendere efficace l’intero processo che porta ad individuare i nuovi farmaci, a partire dall’analisi di una libreria di trilioni di potenziali strutture chimiche, mole di dati che mette in evidenza come sia i DB tradizionali sia quelli non-strutturati (perché questi ultimi elaborano principalmente solo dati non strutturati) non siano in grado di fornire risposte valide in termini di dimensioni, prestazioni e requisiti.

La soluzione

Dompé con i partner lavora quindi all’implementazione di Exscalate, un sistema di screening virtuale sviluppato in collaborazione con il Cineca e il Politecnico di Milano che è tra le più potenti piattaforme di supercalcolo e intelligenza artificiale. La piattaforma serve all’azienda ed al suo dipartimento di ricerca e sviluppo sia per la messa a terra dei progetti industriali sia per le iniziative internazionali ed è in esecuzione su Leonardo. Un investimento tecnologico questo che ha trasformato il processo di drug discovery rendendolo più veloce, più efficiente e meno costoso. Exscalate, è composta da tre moduli: il Tangible Chemical Space, costituito dalla più grande libreria di ligandi virtuali al mondo; il Comprehensive Therapeutic Target Database, un database che contiene informazioni strutturali 3D su proteine riconosciute come bersagli terapeutici e LiGen acronimo spurio che sta per Ligand Generator, il simulatore in silicio per il docking molecolare.

In particolare quindi, con E4 Computer Engineering, è stata decisa l’implementazione di un importante storage cluster (4 nodi), MinIO SW Managed con un layer storage S3 e Gpu Chemical Cartridge la cui completa consistenza è argomentata dall’immagine seguente.

Tutte le specifiche della soluzione per il Tcs
Tutte le specifiche della soluzione per il Tcs

E’ un’infastruttura di questo tipo a dare vita al Tangible Chemical Space attuale che è in grado di abbattere significativamente i tempi per l’identificazione di principi attivi idonei alla produzione di nuovi farmaci. Un’implementazione che ha richiesto le competenze di  progettazione di cluster Hpc, l’esperienza nell’implementazione di componenti ad alte prestazioni, inclusi nodi Gpu, connessioni Mellanox Nvidia, MariaDB ColumnStore ma anche l’utilizzo di compilatori Intel, la configurazione del nodo di gestione, e l’esperienza nel cluster management e nel supporto specialistico di infrastrutture complesse. 

I vantaggi e i benefici

Grazie alla potenza di calcolo del Tcs così implementato, la rappresentazione digitale di miliardi di molecole permette di simulare “in silico” abbinamenti vitali per indirizzare i passaggi successivi della ricerca e abbattere i tempi necessari tra la fase di studio e il risultato utile. Per comprendere i vantaggi in termini pratici si parla di una riduzione di tempo che va dai 10 anni canonici ai 2 anni operativi per il rilascio di un farmaco.

Anna Fava
Anna Fava, senior software engineer, Dompé farmaceutici

Le simulazioni rese possibili operando all’interno del Tangible Chemical Space, infatti, accelerano la manipolazione e il confronto di miliardi di molecole selezionate da reagenti reali e descritte su più dimensioni, su cui vengono operate tutte le possibili combinazioni chimiche identificando le strutture e il componente funzionale così da memorizzare stabilmente tutte le caratteristiche nel database.
Nella ricerca di una specifica molecola ritenuta efficace rispetto a una determinata malattia, sarà possibile individuare subito il gruppo funzionale su cui lavorare. Si possono così trovare sia dei composti nuovi, sia verificare se una molecola già esistente abbia la capacità terapeutica su malattie diverse rispetto a quelle per cui attualmente viene utilizzata.
“L’approccio in co-design ci ha permesso di realizzare un sistema estremamente performante, sviluppando appositamente componenti e configurazioni hardware e software specifici per il nostro caso d’uso. Grazie alla collaborazione con il team tecnico di MariaDB che ha contribuito con miglioramenti al core del motore del ColumnStore DB e alle capacità ingegneristiche dei sistemisti di E4 Computer Engineering specializzati nella realizzazione di infrastrutture di calcolo ad altissime prestazioni – spiega Anna Fava senior software engineer presso Dompé farmaceuticiabbiamo ottenuto un miglioramento dell’efficienza complessiva del sistema Tcs di Dompé di un fattore dieci”.

Un esempio molto concreto dei benefici relativi alla sperimentazione di farmaci per il Covid evidenza come partendo da un numero limitato di composti che potenzialmente potevano avere una capacità di interazione con il Covid, nel giro di 24 ore sono state simulate interazioni tra molecole e agente patogeno per ben mille miliardi di volte. La piattaforma Exscalate ha identificato in brevissimo tempo ben tre principi attivi di cui uno approvato e disponibile per combattere il Covid, mentre muoversi all’interno di un dataset così ampio, avrebbe comportato in passato non meno di tre mesi di lavoro abbattuti grazie al nuovo Tcs così strutturato. 

© RIPRODUZIONE RISERVATA

Condividi l'articolo: