Conoscere l’intero genoma degli organismi permette di poter procedere nella ricerca in silico, come si dice in termini scientifici, ovvero attraverso simulazioni matematiche al computer, invece che in provetta. La genomica si basa di fatto sulla bioinformatica per l’elaborazione delle grandi quantità di dati prodotte, con notevoli vantaggi. In campo biomedico, per esempio, significa identificare con più facilità i geni coinvolti nello sviluppo di determinate malattie, l’interazione degli stessi con “l’ambiente” e il background genetico degli organismi.

Grazie alle scoperte derivanti dal sequenziamento del genoma umano è nata quindi la genetica personalizzata che consente di eseguire studi predittivi, per esempio sull’incidenza di determinate patologie su un campione di individui o sui singoli.

In occasione di Aws Virtual Summit 2020, incontriamo (virtualmente) Andrea Riposati, Ceo di Dante Labs. Si tratta di un’azienda italiana – 22 dipendenti (tra genetistici, biotecnologi, bioinformatici ed esperti di digital marketing), sede a L’Aquila e un ufficio commerciale a New York –  che opera nell’ambito del testing e dell’analisi dei dati genetici, ed è nata con l’intento di avvicinare le persone alle tecnologie genetiche avanzate. L’offerta dell’azienda – il cui canale di vendita principale è proprio il sito – si distingue sul mercato perché Dante Labs analizza il 100% del Dna, quindi il genoma completo, e vanta clienti in 97 Paesi. 

Dante Labs, perché la scelta cloud

Il test completo, per motivi di costi e di difficoltà di analisi dei dati, viene effettuato pochissimo nel mondo, da qui il gradimento della proposta di Dante Labs che ha abbracciato il cloud per superare le limitazioni dei metodi tradizionali. Spiega Riposati: “L’azienda ha iniziato ad operare tra il 2016 ed il 2017 basandosi su un’infrastruttura IT server classica e sfruttando servizi di aziende specializzate nella gestione dei dati sui propri server e data center, ma abbiamo presto riscontrato difficoltà in termini di flessibilità per poter realizzare il tipo di analisi completo che abbiamo scelto”.

L'Aquila inaugurazione Dante Labs
L’Aquila inaugurazione Dante Labs

Il genoma di una singola persona ha un peso, in termini di dati, di circa 100 Gb e per sintetizzarlo è necessaria una considerevole potenza di calcolo. Con l’analisi vengono creati file di dimensioni inferiori che contengono tutte le mutazioni genetiche di una persona. Si tratta di file che pesano comunque circa 150 Mbyte (file di testo con 15 milioni di righe) e permettono di realizzare un numero pressoché infinito di report (per esempio, anche con indicazioni sul tipo di attività sportiva consigliata sulla base del proprio Dna, oppure report medicali su malattie rare, Alzheimer, ma anche sulla comorbilità al Covid-19). “Il problema per Dante Labs – spiega Riposati era che, con l’infrastruttura utilizzata nei primi 15 mesi della nostra attività, il tempo di attesa per un singolo report richiedeva 30/40 minuti e, per avere la flessibilità richiesta nella reportistica, tempi comunque molto lunghi”.

La soluzione

Da qui la decisione di sfruttare le risorse Aws e lo sviluppo interno del software Immensa (ora riconosciuto dispositivo medico CE Ivd) che gira completamente in cloud su Aws per l’analisi dei dati e la generazione dei report. Sono circa 130mila quelli generati nel corso dell’ultimo anno. Dante Labs può ora preparare più report in parallelo su un unico campione, come su campioni diversi. “Tra i servizi Aws utilizzati, Aws EC2, Elastic Cloud Balancing e Aws Lambda fanno la differenza, oltre a questi ne sfruttiamo anche altri tra cui il DB e Amazon S3“, specifica RiposatiAws Lambda consente l’esecuzione di codice senza dover effettuare il provisioning né gestire server; in pratica si può eseguire codice per qualsiasi tipo di applicazione o servizio di back-end, senza bisogno di amministrazione. Una volta caricato il codice, Lambda si attiva sulle azioni necessarie per esecuzione e balancing delle risorse.

Dante Labs, come funziona il servizio

Nel modello di business di Dante Labs, quindi, un utente acquista un test del genoma completo sul sito dell’azienda. Dante Labs spedisce un kit per la raccolta della saliva, con inclusa già la bolla Dhl prepagata, il cliente registra il kit con un codice a barre unico sul portale (sempre su Aws) e restituisce il kit, mentre il codice a barre resta già tracciato per tutti i servizi di logistica. L’azienda processa il kit, mentre automaticamente il cliente riceve le relative email di aggiornamento. Riposati: “Il Laboratory Information Management Systems (Lims) di Dante Labs è integrato con interfaccia utente e software per la gestione del report, invece in precedenza l’azienda utilizzava un software commerciale per il lab, uno di terze parti per il report, e l’interfaccia Dhl per la logistica, con tutte le difficoltà di integrazione del caso”. 

Dal campione di saliva viene estratto il Dna che entra nei sequenziatori che lavorano sul genoma e generano i 100 Gbyte di informazioni per ogni individuo. “Sono necessarie circa 48h per sequenziare completamente 32/36 campioni, ed ogni 48h Dante Labs analizza circa 250 campioni. Solitamente altre realtà lavorano utilizzando più sequenziatori collegati ad un server locale, su cui vengono svolte alcune delle operazioni, per poi passare al trasferimento in cloud o il cliente finale. Dante Labs, invece, grazie ad Aws, fa direttamente lo streaming in cloud dei dati e offre lo sharing sicuro ai clienti con Amazon S3 (i dati sono sempre criptati)”.

I clienti americani che desiderano i dati negli Usa, possono scegliere di avere lo streaming in una region Aws Usa, idem per i clienti europei, e ora in modo specifico vale lo stesso per i clienti italiani, considerata la recente apertura della region locale che ha sollevato alto interesse anche da parte della PARiposati spiega i vantaggi di aver digitalizzato la maggior parte dei processi: “Chi ha già analizzato il genoma con l’azienda può tornare sul sito, acquistare un report nuovo che attiva un’istanza Lambda in grado di preparare in autonomia il report, nella lingua scelta, ed inviarlo al cliente quando pronto, con un risparmio di tempo enorme, anche dal punto di vista logistico”.

La scelta di utilizzare il cloud Aws nasce anche per ragioni di sicurezza e di privacy. Per la natura dei dati trattati infatti il laboratorio è soggetto a un rigido protocollo. Il sistema cloud utilizzato da Dante Labs permette di ricostruire l’intero percorso del dato, di individuare chi ne ha avuto accesso e di cancellarlo con facilità da tutti i dispositivi collegati.

Sempre per quanto riguarda la sicurezza abbiamo appena accennato all’utilizzo di dati e sistemi criptati, sia a livello di analisi sia di storage. Riposati aggiunge “il kit che viaggia è anonimo accompagnato solo dal codice a barre. I dati identificativi della persona vengono salvati su un account DB Aws indipendente; su un secondo account Aws viene salvato l’account genetico e il terzo account, anch’esso isolato, è deputato esclusivamente al matching tra l’identificativo del cliente (email) e il codice a barre del dato genetico. Tre account quindi separati anche a livello di billing, del tutto agnostici tra loro”.

Per quanto riguarda la scelte delle tecnologie Aws, Dante Labs utilizza un alto numero di istanze Lambda soprattutto per la flessibilità nella gestione dei picchi. E strumenti di Intelligenza Artificiale per integrare il dato genetico con la storia clinica del paziente. Ogni individuo infatti presenta circa 15 milioni di varianti (mutazioni genetiche), di circa il 90% del Dna però non si conosce l’utilità e alcune varianti, a seconda delle origini dell’individuo (provenienza geografica), possono effettivamente determinare o meno l’insorgenza di malattie.

E’ importante capire quindi siano le singole varianti in grado di spiegare una malattia. Quindi “sulla base della storia medica del paziente, Dante Labs standardizza dei modelli e sfruttando una rete neurale su Aws cerca, sulla base delle varianti patogeniche, quella corretta per una diagnosi precisa. Il motore di Aws permette con costi contenuti di effettuare una serie di correlazioni in modo veloce, ma gran parte del lavoro viene svolta comunque dall’intelligenza del nostro software”

Dante Labs, i prossimi obiettivi

“Per quanto riguarda i futuri sviluppi del progetto – racconta Riposati – stiamo lavorando per consentire ai medici, ovunque si trovino, l’accesso alla conoscenza sviluppata analizzando i genomi. Vorremmo rilasciare un software per cui qualsiasi medico può inserire la descrizione dei sintomi della malattia e fare una ricerca sui diversi DB integrati per trovare quali possano essere le cause. Sarebbe utile per le malattie rare, l’analisi dei tumori e nei casi epidemici come il Covid-19.
Riposati in proposito specifica: “Quando una persona risulta positiva al tampone è comunque difficile immaginare l’evoluzione della malattia, invece con la disponibilità di una serie di correlazioni sui profili genetici potrebbe essere più facile capire come agire, anche per compiere le scelte migliori in fase preventiva”.

Dante Labs oggi già dispone di una rete globale di utenti con accesso alla piattaforma per consultare le informazioni genetiche e mediche (ovviamente anonime) integrate tra loro; l’interrogazione della piattaforma potrebbe diventare ancora più intelligente.

Gli sviluppi richiederanno l’integrazione di servizi Aws SaaS e di Cdn (Content Delivery Network) ed ulteriori investimenti sull’AI. “L’azienda si è appena aggiudicata un bando di Invitalia per un milione e mezzo di euro, su due milioni di investimenti complessivi, da indirizzare proprio allo sviluppo. Per l’emergenza Dante Labs ha costruito un laboratorio Covid specifico per analizzare tamponi e fare test sierologici in scala, ed integrare l’analisi genetica Rna virale del Covid e infine il genoma (in modo da studiare per esempio le predisposizioni ad un’evoluzione grave della malattia)”

Dante Labs nel corso del 2019 ha analizzato circa 12mila genomi completi (al massimo serve qualche settimana per ogni analisi, ma in urgenza anche meno di una) – circa il 3% dei genomi completi analizzati a livello globale – ed ha fatturato circa 3 milioni e mezzo di euro. Quest’anno Riposati prevede ricavi “tra i 15 e i 18 milioni, con una crescita quindi esponenziale, maturati anche sulla base di un costo del servizio comunque contenuto, tra i 600 e i 1.000 euro”. Chiude il Ceo: “Spesso si pensa che grandi laboratori con una ampia disponibilità di macchinari siano avvantaggiati in modo sensibile per queste analisi, ma si parla di analisi in cui viene “canalizzata” solo una piccola percentuale del Dna (inferiore all’1%, con software non ottimizzati per analizzare genomi completi), perché studiare decine di milioni di varianti è complesso. La scarsa disponibilità di analisi sui campioni non è però imputabile semplicemente alla disponibilità di macchinari, quanto piuttosto a una serie di complessità amministrative, alla mancanza di automazione nella logistica e alla semplice gestione delle pratiche di refertazione, soggette ancora a metodologie antiquate”. Aspetti su cui chi non innova, ha ancora molto da lavorare.

© RIPRODUZIONE RISERVATA