Si è chiuso da pochi giorni l’evento Evolve 2023 a Roma, l’occasione per Cloudera di incontrare prospect, clienti e partner che si confrontano su come le strategie di valorizzazione dei dati e Cloudera Data Platform possono trasformare il business e consentire la risoluzione dei problemi nella gestione delle informazioni. A valle dell’evento, incontriamo Fabio Pascali, Regional Vice President Italy di Cloudera per fare il punto su strategia e novità tecnologiche.

La proposta di Cloudera punta a trasformare dati complessi in insight chiari e fruibili. Grazie alla piattaforma “hybrid data”, le organizzazioni possono quindi elaborare decisioni di business, con i dati, indipendentemente da dove risiedono, pronti a generare valore. “La piattaforma Cloudera è hybrid nel senso più puro del termine, perché può essere utilizzata, on-premise, come nei diversi cloud pubblici in modalità PaaS di fatto in modo agnostico e trasparente – esordisce Pascali -. Non si tratta di una proposta ‘statica’ ma consente di lavorare on-premise, e poi portare/spostare workload e use case in public cloud (e nel multicloud), convertendo a seconda dei bisogni il loro modo di consumare la piattaforma che mantiene le sue radici open source (a partire dallo stack Apache) e si integra facilmente con strumenti di data visualization, AI generativa etc.”.

Pubbliche amministrazioni (per esempio Inail), telecomunicazioni, utility, manufacturing, finance, tra i verticali che beneficiano delle sue caratteristiche dipiattaforma end-to-end che integra la sfera data warehouse con quella dei data lake, i dati strutturati con quelli non strutturati. Così come consente di coprire il ciclo di lavorazione del dato in movimento, dall’ingestion all’edge, etc. per indirizzare diverse tipologie di use case nei diversi ‘stadi’ del dato”. Hybrid, open-source ed end-to-end sono quindi anche i tre tratti principali caratterizzanti la piattaforma.

Fabio Pascali, regional vice president Italy di Cloudera

In modalità on-premise o ibrida, in public cloud, nei multicloud, piattaforma, governance e data lineage (tecnica che consente di identificare e rappresentare il ciclo di vita del dato) non cambiano. “Questi di fatto gli elementi che ben rappresentano l’unicità della propostaprosegue Pascali – che vede la sua ossatura importante nel data fabric che si estrinseca nella Cloudera Shared Data Experience (Cloudera Sdx), quindi la capacità di gestire sicurezza e governance, dove sono i dati e chi vi può accedere, con l’opportuna centralizzazione del dato e la possibilità di sviluppare e rilasciare prodotti per i vari dipartimenti abilitando un virtuoso data mesh“.

Coerentemente quindi la platform è già orientata verso i modelli più recenti di automatizzazione nel consumo del dato (machine learning, AI etc.), con un punto fermo: “il valore nell’elaborazione del dato non sta tanto nella ‘costruzione’ della piattaforma dati, ma nel fatto di consentire di trasformare i requisiti del consumo del dato in use case reali.
Un punto su cui è evidente l’importanza del lavoro con i partner, con i system integrator e tutto l’ecosistema, “impegnato più che sulla rivendita, sulla reale ‘integrazione’ della platform, con use case che sposso sono realizzati da diversi partner che insistono e lavorano per attività specifiche anche sulla stessa azienda”. Interessante, tra i progetti presentati in occasione di Evolve 2023, a Roma, quello nell’ambito della sanità in via di realizzazione per costruire la piattaforma dati della telemedicina (Piattaforma Nazionale di Telemedicina).

Cloudera Evolve Data Study

Gli sforzi di sviluppo di Cloudera sembrano trovare il riscontro dei bisogni delle aziende, evidenziati in particolare dalla ricerca Evolve Data Study che mette a fuoco anche le criticità che le aziende incontrano sul campo. Condotta tra marzo ed aprile 2023, da Coleman Parkes Research, l’indagine valuta le opinioni di 850 decision maker IT responsabili dell’analisi dei dati e degli strumenti nella loro organizzazione nella regione Emea (100 gli italiani che hanno partecipato).

Gli intervistati provengono da organizzazioni con più di mille dipendenti in ambito finanziario, bancario, assicurativo, manifatturiero, telecomunicazioni, vendita al dettaglio ed e-commerce, health e life science, PA, tecnologia e software, energia e servizi pubblici, istruzione, media, tempo libero e intrattenimento. “Lo studio è focalizzato sull’area del mondo dati e la sfera cloud – introduce Pascaliche si interseca con la proposizione di Cloudera, ma soprattutto svela che circa il 32% dei dati aziendali ancora oggi non è utilizzato in modo efficace, e praticamente tutti i decision maker (97%) prevedono di portare dati e workload nel cloud, nei prossimi tre anni. Al tempo stesso, il 78% di essi è pronto a riportare dei workload on-prem. Questo perché le aziende fanno ‘fine-tuning’ ragionando su pregi, limiti e costi del cloud, oltre che sui temi di compliance e di sovranità sui dati che pur sono riflessioni maturate anche prima di muovere i carichi di lavoro”.

Inoltre, in Italia, oltre tre quarti degli intervistati (76%) concordano sul fatto che la presenza di dati in diversi ambienti cloud e on-premise rende complesso estrarne valore. Tuttavia, più di due terzi (67%) li archivia in un ambiente ibrido, ovvero utilizza sia il cloud on-premise/privato che il cloud pubblico. “Quasi sette organizzazioni su dieci (68%) hanno adottato un modello multicloud e lavorano con due o più hyperscaler. E questo incrementa la complessità e le difficoltà”. Numeri e priorità. Le preoccupazioni relative ai dati e alla conformità (59%), i timori di cloud lock-in (53%) e le sfide relative alla complessità e all’integrazione dell’IT (50%) sono citate come le principali ragioni per cui le organizzazioni sono restie a spostare altri dati in cloud, oltre ai ragionamenti sui costi. Inoltre, la metà degli intervistati (49%) afferma che i problemi di prestazioni nell’elaborazione di grandi insiemi di dati in tempo reale rappresentano un altro ostacolo significativo alla migrazione al cloud. 

Cloudera, a questo proposito, grazie alla sua platform che lavora in modo uniforme dal punto di vista logico “lima già la complessità e propone un’unica governance nel multicloud. A livello PaaS sui tre maggiori hyperscaler, e come proposta utilizzabile facendo leva su una logica IaaS con Oracle e Ibm”. Certo è che le aziende in grado di sfruttare i propri dati in modo rapido, indipendentemente dalla loro ubicazione, scopriranno di avere un rilevante vantaggio competitivo.

E la data analytics gioca un ruolo importante al riguardo, in particolare, nell’ordine per i team IT, i reparti finance, vendite marketing, operation e HR, in percentuali decrescenti tra il 60% dei primi e il 41%, quindi entro una forbice di fatto nemmeno troppo ampia, mentre quasi il 70% del campione è convinto di disporre di un numero eccessivo di strumenti di analisi, ed appena la metà di esso è del tutto consapevole di quanti strumenti di data analytics sono stati implementati. Coloro che hanno questa certezza dichiarano, comunque, di utilizzare ben cinque strumenti diversi.
I dati a silos restano la sfida più sentita. “Cloudera oggi elabora con la sua piattaforma oltre 25 exabyte di dati a livello globale, un volume di dati in scala con quello che trattano gli hyperscaler e ha superato nel suo ultimo anno fiscale il miliardo di dollari di ricavi, prevalentemente basati sul rinnovo delle subscription e delle licenze per il consumo della piattaforma, nel tipico modello basato sui crediti”, snocciola Pascali

Cloudera Observability e approccio all’AI ‘controllata’

In concreto, per indirizzare il tema della valutazione dei costi nel consumo dei dati Cloudera Data Platform si arricchisce di Cloudera Observability come strumento che fornisce insight pratici su dati, applicazioni e componenti dell’infrastruttura al fine di ottimizzare i costi, risolvere i problemi e migliorare le prestazioni. La governance finanziaria e FinOps consentono di gestire il budget sulla piattaforma Cdp per evitare sforamenti e consentire proiezioni di capacità a fini di pianificazione.

E Cloudera Observability è disponibile per tutti i clienti utilizzatori di Cloudera Data Platform in ambienti cloud pubblici o privati:“consente di monitorare le performance degli use case critici in cloud, per esempio anche quelli Esg ed i costi dei consumi della platform in multicloud”. Gli utenti beneficiano inoltre di azioni automatiche personalizzabili e precostituite per generare avvisi, evitare proattivamente i problemi e ottimizzare i carichi di lavoro.
Importante ulteriore sviluppo che riguarda anche Cloudera Observability, ma non solo, è l’interoperabilità con Apache Iceberg, elemento chiave dell’open data lakehouse di Cloudera disponibile con la Data Platform. “Si tratta di un formato tabellare open, per tabelle analitiche di grandi dimensioni, che consente di portare le funzionalità del mondo transazionale e relazionale tipico dei data warehouse nella sfera data lake”. Per questo conferisce affidabilità ai big data, rendendo possibile il lavoro simultaneo di più motori di calcolo. “Sulla base di questa proposition ci attendiamo una forte spinta esecutiva sui progetti legati al mondo open lakehouse“, precisa Pascali

La terza sfera degli annunci degli ultimi mesi per Cloudera  (insieme a Cloudera Observability e Apache Iceberg) riguarda Generative AI. “Abbiamo registrato l’hype sul tema e Cloudera cerca di capire come trasformare le richieste dei clienti in valore sulla base di queste tecnologie, il cui limite consiste nel dover dare accesso ai dati a tool fuori di fatto dal controllo di chi detiene i dati, con relativa perdita anche sulla qualità delle risposte che si potrebbero ottenere”, spiega Pascali.

Per questo l’azienda propone Llm Augmented with Enterprise Data, come blueprint per Large Language Model (Llm), pronto all’uso, che aiuta le imprese a utilizzare l’AI generativa a partire dai dati disponibili all’interno del proprio contesto aziendale.
In questo modo è possibile gestire e sbloccare il valore dei propri dati su cloud privati e pubblici, con la soluzione Cloudera Open Data Lakehouse a riunire le funzionalità di un data warehouse e di un data lake ed alimentare soluzioni di business intelligence, AI e machine learning (ML), e ad offrire la flessibilità per implementare il cloud privato e pubblico di preferenza con la stessa esperienza. Cloudera mette a disposizione, all’interno di Cloudera Machine Learning, modelli preconfezionati per accelerare la generazione di un modello applicabile ed in concreto, le aziende possono costruire la propria applicazione di AI alimentata da un Llm open source di loro scelta, ospitando tutto internamente.

© RIPRODUZIONE RISERVATA

Condividi l'articolo: