Negli ultimi 2/3 anni, l’osservabilità ha guadagnato terreno come elemento essenziale per l’efficienza e la produttività delle aziende, soprattutto quelle che operano nel settore IT. Con l’evoluzione continua delle tecnologie digitali, infatti, la complessità dei sistemi è cresciuta, rendendo essenziale la necessità di avere una visione completa su ogni componente. L’osservabilità consente di monitorare e analizzare in tempo reale lo stato di salute di sistemi, applicazioni e infrastrutture, garantendo che le organizzazioni possano rispondere prontamente a eventuali anomalie e interruzioni. 

Di cosa si parla, precisamente? Si parla della capacità di un sistema di fornire visibilità sul suo stato interno attraverso la raccolta, il monitoraggio e l’analisi di vari tipi di dati (log, metriche e trace) generati dalle sue operazioni. Questo concetto è fondamentale per le organizzazioni che devono gestire infrastrutture distribuite e ibride, composte da servizi cloud, on-premise e applicazioni di terze parti. Non si può ridurre l’osservabilità al semplice monitoraggio, proprio perché il termine fa riferimento alla capacità di comprendere che cosa sta accadendo all’interno di un sistema analizzandone gli output esterni.
Traccia i trend e precisa gli spunti di riflessione sul tema lo studio Splunk, The State of Observability 2024.

Il report si basa su un’indagine globale condotta da Splunk in collaborazione con Enterprise Strategy Group (Esg) durante i mesi di maggio e giugno 2024. Sono stati intervistati 1.850 professionisti di vari settori, inclusi dipendenti, manager e dirigenti dell’area IT Operations (ITops), sviluppatori, ingegneri e Site Reliability Engineers (Sre), di dieci paesi tra cui anche l’Italia oltre a Australia, Francia, Germania, India, Giappone, Nuova Zelanda, Singapore, Regno Unito e Stati Uniti. Le organizzazioni partecipanti hanno almeno 500 dipendenti a tempo pieno e coprono complessivamente 16 diversi verticali, tra cui manifattura, sanità, tecnologia, finanza, media e telecomunicazioni​​. 
Un primo dato: quasi la metà degli intervistati (47%) utilizza strumenti di osservabilità da oltre due anni, con un incremento significativo rispetto al 36% dell’anno precedente.

Osservabilità, oltre il monitoraggio dei sistemi

Il report Splunk del 2024 introduce in particolare un quadro specifico per misurare la maturità dell’osservabilità, suddiviso in quattro fasi che indicano il livello di sofisticazione delle pratiche adottate dalle organizzazioni: “agli inizi”, “emergenti”, “in evoluzione” e “leader”. Il 45% delle aziende intervistate si trova nella fase iniziale, il 27% è in una fase emergente, il 17% è in evoluzione e l’11% può essere considerato leader.

Cosa caratterizza le aziende leader nell'osservabilità
Cosa caratterizza le aziende leader nell’osservabilità (fonte: The State of Observability, Splunk, 2024)

Le aziende più avanti nei progetti non raggiungono questo status per caso, ma grazie a strategie chiare e all’adozione delle giuste tecnologie. Secondo il rapporto, le organizzazioni leader sono in grado di rilevare un problema entro pochi minuti o addirittura secondi dall’inizio di un’interruzione, con un’efficacia che è 2,8 volte superiore rispetto alle aziende meno mature. Inoltre, le aziende più avanzate stimano che l’80% degli alert che ricevono sia legittimo, mentre le organizzazioni agli inizi spesso faticano a distinguere tra veri e falsi positivi, con solo il 54% degli alert effettivamente rilevanti.

Patrick Lin
Patrick Lin, Svp e GM Observability di Splunk

Patrick Lin, Svp e GM Observability di Splunk, sottolinea allora come “costruire una pratica di osservabilità leader significa essere ossessionati dall’offrire esperienze digitali migliori ai clienti e incorporare questa mentalità in ogni decisione”. Una mentalità che non solo previene incidenti tecnici, ma apre alla possibilità di innovare e migliorare l’efficienza.

Si conquistano così vantaggi tangibili in termini di produttività, risoluzione dei problemi e velocità di sviluppo. Per esempio, il 76% delle organizzazioni leader implementa la maggior parte del codice applicativo su richiesta, mentre lo fa solo il 30% delle organizzazioni agli inizi. Questo permette a chi più è avanti di rispondere rapidamente alle esigenze del mercato e dei clienti. Le aziende leader dedicano anche il 38% in più del loro tempo all’innovazione, riducendo il tempo speso per attività di routine e gestione degli incidenti.

Il focus sulle esperienze digitali e l’innovazione tecnologica si riflette anche nella crescente adozione di tecnologie avanzate come OpenTelemetry e AI. Il primo è di fatto standard di settore per la raccolta e la gestione di questi dati, offrendo alle organizzazioni un approccio open-source che evita il vendor lock-in e permette un maggiore controllo. Nel 2024, il 78% delle organizzazioni classificate come leader adotta OpenTelemetry, rispetto al 58% complessivo degli intervistati. Questo perché con OpenTelemetry le organizzazioni possono facilmente integrare una vasta gamma di tecnologie nel proprio ecosistema, accedendo a un insieme più ampio di strumenti e piattaforme.

I vantaggi dell'OpenTelemetry per le aziende
I vantaggi dell’OpenTelemetry per le aziende (fonte: The State of Observability, Splunk, 2024)

Un dato: il 57% delle organizzazioni leader ha dichiarato di aver ottenuto una riduzione significativa dei costi grazie a queste pratiche. Il report evidenzia inoltre che una gestione efficace del pipeline di telemetria consente alle organizzazioni di migliorare la qualità dei dati analizzati e di ottimizzare le risorse. Secondo il report, le tecniche di gestione del pipeline più apprezzate includono la trasformazione e aggregazione dei dati, che permettono di ridurre i volumi di dati e i relativi costi di archiviazione, mantenendo al tempo stesso alta la qualità delle informazioni utilizzate per prendere decisioni. Si introduce così il tema del platform engineering come attività di progettazione e sviluppo di toolchain e processi di lavoro che permettono di rendere tutti gli addetti autosufficienti in tutte le attività software engineering.

Evoluzione DevOps con il platform engineering

Nel 2024, il platform engineering emerge come una disciplina cruciale per il futuro del DevOps. Il 73% delle organizzazioni ha già adottato il platform engineering in modo estensivo, riconoscendo il valore di standardizzare toolchain e workflow per migliorare l’efficienza e ridurre il carico di lavoro sui team di sviluppo. Il platform engineering consente agli sviluppatori di concentrarsi maggiormente sull’innovazione e meno sulla gestione degli strumenti e dei processi, con il 58% delle aziende leader che considera questa pratica un differenziatore competitivo.
Le organizzazioni che adottano il platform engineering vedono un miglioramento significativo dell’efficienza operativa e della produttività degli sviluppatori. Il 55% degli intervistati ha riportato un aumento dell’efficienza IT, mentre il 40% ha registrato una maggiore produttività degli sviluppatori. Questo permette di accelerare il rilascio di nuove funzionalità e prodotti, contribuendo al successo aziendale a lungo termine.

Il ruolo dell’AI

Nel 2024, l’adozione di intelligenza artificiale (AI) e machine learning (ML) è diventata essenziale per migliorare l’osservabilità. Secondo il report, il 97% delle organizzazioni utilizza sistemi basati su AI/ML per correlare eventi, rilevare anomalie e consigliare azioni correttive. L’utilizzo di questi strumenti permette alle organizzazioni di migliorare l’efficienza operativa e di risolvere i problemi più rapidamente.
Un esempio concreto riguarda la riduzione del cosiddetto alert noise. Le organizzazioni leader, infatti, risolvono metà o più degli alert grazie all’automazione basata su AI, rispetto a solo il 16% delle organizzazioni meno mature.

L'AI per riconoscere gli alert, i vantaggi
L’AI per distinguere gli alert, i vantaggi per le aziende più mature (fonte: The State of Observability, Splunk, 2024)

L’AI generativa, pur essendo una tecnologia emergente, sta già iniziando a trasformare l’osservabilità. Chatbot e assistenti AI sono utilizzati per analizzare grandi quantità di dati e fornire raccomandazioni basate su query in linguaggio naturale. L’interesse verso queste tecnologie è alto: l’84% delle organizzazioni ha esplorato le funzionalità di AI generativa all’interno dei propri strumenti di osservabilità, anche se l’adozione effettiva rimane limitata.

Le organizzazioni che desiderano diventare leader dell’osservabilità devono adottare un approccio strategico che includa tecnologie all’avanguardia come OpenTelemetry e AI, e che promuova la collaborazione tra i team. La convergenza tra dati di sicurezza e osservabilità sarà un elemento chiave per migliorare il tempo medio di risoluzione (Mttr), tanto che il 73% delle organizzazioni leader ha migliorato significativamente questa metrica grazie a flussi di lavoro unificati. Il vantaggio competitivo dell’osservabilità non si fermerà alla risoluzione dei problemi. Il rapporto Splunk mostra infatti che le organizzazioni leader ottengono un ritorno sugli investimenti pari a 2,6 volte i costi, con miglioramenti in tutte le aree operative, dall’efficienza alla velocità di innovazione.

© RIPRODUZIONE RISERVATA

Condividi l'articolo: