L’ecosfera dei dati entro il 2025 supererà il volume di 180 zettabyte (fonte: Statista), il problema oggi però non è quello della mancanza di informazioni, quanto piuttosto di trasformare le informazioni in insight, perché generare dati e mantenerli vivi ed utilizzabili altrimenti è semplicemente costoso, e non serve. Mantenere il controllo dei dati è poi la via da seguire per un’effettiva trasformazione aziendale con machine learning e AI come abilitatori. Cloudera, in questo contesto, sviluppa per consentire analisi e gestione dei dati ibridi su larga scala sia nei data center sia nei cloud pubblici, con un approccio ibrido e agnostico rispetto alle piattaforme. E la sua Cloudera Data Platform (Cdp) evolve sulla base dell’assunto per cui è prioritaria la possibilità di spostare in modo sicuro dati e tool di analisi in modo bidirezionale tra i DC e più data cloud. Solo alcuni capisaldi di riferimento: Cdp è la platform ibrida pensata per consentire il medesimo utilizzo dei dati per ogni tipo di analisi on-premise e in ogni cloud (privato/pubblico/ibrido) così da assecondare gli economics a seconda dei differenti workload.
Più nel dettaglio, Cdp combina gestione, analisi, transazionali e data science nei diversi ambienti, offrendo analisi dei dati nativa per il cloud lungo tutto il ciclo di vita dei dati: dall’ingestion alla distribuzione, nelle fasi data engineering, e di data warehousing, con i dati transazionali così come quelli in streaming, per un’esperienza coerente sulle diverse architetture.
Questi i temi di abbrivio dell’incontro con Fabio Pascali, regional director di Cloudera in Italia. Il più importante riguarda Cloudera Data Platform (Cdp) One, l’offerta software as a service (SaaS) di data lakehouse all-in-one.
“Cloudera Cdp One si qualifica come piattaforma per gestire i dati in modo open, integrato e con la sicurezza embedded. Ora abbiamo messo a disposizione i clienti, una versione completamente SaaS“. Nata on-premise, l’evoluzione ha portato la piattaforma ad essere disponibile prima in public cloud come PaaS “e l’experience di data service è ora pronta anche per le diverse modalità di consumo in SaaS”.
La gestione del dato dall’ingestion, allo streaming analytics al lakehouse, al ML – quindi, in modo sempre più integrato – nella proposta SaaS “solleva l’utente dalla gestione non solo della piattaforma ma anche delle risorse sottostanti, sulla scorta di un modello Zero Ops, per un’analisi self-service semplice e veloce”. Cloudera per erogare il servizio opera in modo trasparente rispetto al cliente, al momento con Aws, e così come è già accaduto nella proposizione PaaS (disponibile con i principali hyperscaler) anche per la proposta SaaS sono in fase di valutazione gli altri public cloud provider.
Con la proposta SaaS è ovviamente accelerato il time to value con un accesso immediato alla piattaforma, per esempio per sviluppare algoritmi di machine learning sfruttando i tool di sviluppo rapido disponibili. Prosegue Pascali: “Il Tco complessivo può essere ridotto tra il 20% ed il 35%, rispetto all’approccio tradizionale. La proposta incontra tra l’altro quelle realtà che vorrebbero utilizzare la piattaforma in cloud ma o non hanno le competenze interne per gestione, sicurezza ed implementazione, oppure non hanno tempo e vorrebbero far partire un progetto in tempi più rapidi”.
L’esperienza già standardizzata per i vari form factor consente quindi, senza lock-in, di portare quanto già sviluppato per un modello PaaS in SaaS e viceversa, cambiare il provider su cui poggia la platform, o riportare i carichi di lavoro on-premise. Tra i principi fondamentali su cui si incentra lo sviluppo della piattaforma c’è infatti proprio la scelta “ibrida”, per un’effettiva indipendenza dalla sfera infrastrutturale: un aspetto apprezzato dai clienti che consente di portare la piattaforma anche alle aziende non enterprise.
Cwt (Carlson Wagonlit Travel) per esempio ne ha apprezzato la scalabilità verso il basso, con il modello Cloudera Data Platform One (SaaS) che si basa sugli effettivi consumi, sia delle risorse di piattaforma, sia di quelle cloud (calcolo, storage, etc.).
“Diventare un’azienda data driven è l’obiettivo, e passare attraverso una piattaforma che consenta di ottenere i risultati quanto prima è la via”. E anche in Italia non mancano i casi di aziende che hanno adottato Cloudera Data Platform nelle sue diverse declinazioni (on-premise, PaaS e ora SaaS). Energy e utility, telco, public sector ed il mondo finance i verticali più sensibili alla proposta Cloudera. “Con la PA che negli ultimi anni ha raggiunto lo stesso livello di maturità degli altri settori, nello sviluppo dei servizi e nell’ottimizzazione dei costi. In particolare l’healthcare“.
Data fabric, data lakehouse e data mesh, sono tre macro riferimenti nella proposta Cloudera. Data fabric inteso come “esoscheletro della sfera dati”, quindi dalla parte di sicurezza embedded (denominata Sdx – Shared Data Experience) fino alla componente di trasporto dei dati (ingestion, lakehouse, ML).
Cloudera consente di portare il dato da qualsiasi sorgente a qualsiasi destinazione, e fa leva sulle sue scelte “ibride“, ma anche sull‘open source. Cloudera sviluppa la platform nell’ecosistema open (a partire da Apache e relative componenti) e questo, anche per la PA, rappresenta un importante vantaggio, oltre ad aprire effettivamente le porte alle scelte multicloud. Il terzo vantaggio è l’apertura della platform con relative possibilità di integrazione (oltre 250 i connettori disponibili). Gli sviluppi di Cdp ora guardano all’evoluzione del data lakehouse per consentire ai team di BI e data scientist di lavorare su un’unica piattaforma, e al data mesh come paradigma tecnologico ed organizzativo nuovo che punta a considerare il dato come “prodotto” per consentire ai vari dipartimenti di sfruttarlo appieno ma in modalità controllata e gestita.
Oltre alle funzionalità di Secure Data Replication, che Sdx ha introdotto, tra le innovazioni di Cloudera a livello di data analysis e di gestione dei dati ibridi, la platform propone Portable Data Services, per spostare in modo rapido ed efficiente servizi di data analytics e relative applicazioni tra infrastrutture diverse, senza la necessità di doverle sviluppare nuovamente o ricostruirne l’architettura, con tutti i costi relativi. Con Secure Data Replication, invece, è possibile copiare o spostare dati e metadati, spesso generati in luoghi diversi da quelli in cui sono necessari, tra diversi ambienti basati su piattaforme Cloudera in data center e cloud pubblici. Ed infine Universal Data Distribution consente alle aziende di assumere il controllo dei flussi di dati, dall’origine a tutti i punti di utilizzo, sia on-premise che nel cloud, in modo semplice, sicuro, scalabile ed economico.
La riuscita dei progetti è legata anche all’impegno, importante, dei system integrator (tutti i più riconosciuti lavorano con Cloudera). Per esempio, Cloudera è presente nel Cloud Innovation Center di Accenture ed ha rilasciato, tra le varie iniziative, anche uno use case per elaborare in tempo reale i dati di posizionamento di un’auto di soccorso per aiutare l’operatore nelle attività decisionali sulla scorta del suggerimento di una serie di opzioni. La collaborazione con l’ecosistema è strategica per l’azienda, sulla scorta di un approccio che vuole essere consulenziale. E piace. “Cloudera cresce in Italia grazie alle competenze non solo dei team di vendita ma anche dei team di engineering e dei professional services – chiude Pascali -. Oltre la semplice subscription, partner e system integrator guadagnano dallo sviluppo nel tempo con lo use case a guidare l’evoluzione dei progetti. Ed in Italia l’azienda cresce anche più della corporate e negli ultimi tre anni ha triplicato l’annual recurrent revenue”.
© RIPRODUZIONE RISERVATA