La crescita esponenziale dei dati telemetrici generati dalle architetture cloud-native, distribuite, così come di quelle basate su microservizi impone alle organizzazioni una revisione profonda delle proprie strategie di log management. Non si tratta soltanto di raccogliere e archiviare eventi: la vera sfida è trasformare i log in una risorsa di valore operativo e di business, capace di guidare decisioni rapide e informate. In questo scenario, Dynatrace propone una visione che rompe con gli approcci tradizionali, puntando su una piattaforma unificata in cui log analytics, osservabilità e intelligenza artificiale convergono in un unico punto di controllo.

Log management, perché è strategico

All’interno di un percorso strategico verso una piattaforma di osservabilità IT basata sull’intelligenza artificiale i log rappresentano una dei pillar fondamentali che permettono di avere ulteriori dati di telemetria. Ogni applicazione, servizio, container e infrastruttura genera un flusso continuo di eventi che, se analizzati correttamente, offrono visibilità completa sullo stato di salute dei sistemi, sulle cause radice dei problemi e sulle opportunità/possibilità di ottimizzazione. Il problema è che, con la diffusione del multicloud e delle architetture a microserviziil volume di dati telemetrici è cresciuto a ritmi insostenibili per gli strumenti di monitoraggio convenzionali.

Secondo le stime di Gartner, entro il 2026 il 40% dei dati di log sarà gestito attraverso pipeline di telemetria dedicate, rispetto a meno del 10% di quanto si è rilevato solo quattro anni fa. Forrester, dal canto suo, evidenzia come la crescita esponenziale dei dati rappresenti una delle sfide più critiche introdotte dagli ambienti cloud-native. Il risultato è un circolo vizioso: i team dedicati al site reliability engineering (Sre) necessitano di volumi sempre maggiori di log, metriche e tracce conservati nel tempo per migliorare le proprie capacità analitiche e di AIOps, ma l’aumento della retention comporta costi di storage elevati. Le piattaforme tradizionali rispondono a questa pressione con il campionamento dei dati o con periodi di conservazione ridotti, costringendo le organizzazioni a compromessi che penalizzano la qualità delle analisi.

A questo si aggiunge il problema della cosiddetta “reidratazione”: molte soluzioni consentono di archiviare i log meno recenti su cold storage a basso costo, ma il recupero di questi dati per renderli nuovamente interrogabili richiede tempi che variano da ore a giorni e comporta costi aggiuntivi significativi per la reindicizzazione. Un modello che si rivela particolarmente critico proprio nei momenti in cui la rapidità di accesso ai dati è essenziale, ad esempio durante la gestione di un incidente in produzione.

Sbloccare il potenziale dei log, l’approccio di Dynatrace

L’approccio proposto da Dynatrace si distingue per la capacità di eliminare alla radice il tradizionale triangolo di compromessi tra costovelocità e profondità di analisi. Il primo pilastro di questa strategia è il consolidamento degli strumenti di log management all’interno di una piattaforma di osservabilità unificata. La proliferazione di tool specializzati – fenomeno noto come “tool sprawl” – genera silos informativi che rallentano la correlazione tra dati eterogenei e allungano i tempi di identificazione e risoluzione degli incidenti. In un modello unificato, i log non sono più un silo separato, ma vengono automaticamente contestualizzati con tracce distribuite, metriche infrastrutturali, sessioni utente e dati di sicurezza. Questo significa che un team applicativo può navigare dalla segnalazione di un’anomalia fino alla riga di log rilevante senza dover attendere dati da altri team né correlare manualmente timestamp e identificativi di sessione.

Il secondo elemento distintivo è la capacità di rendere l’analisi dei log accessibile anche a chi non possiede competenze avanzate di query. Una delle barriere storiche all’adozione diffusa del log analytics nelle organizzazioni è la complessità delle espressioni regolari (regex, ovvero sequenze di caratteri speciali che definiscono uno schema di ricerca per manipolare, validare o estrarre testo), tradizionalmente necessarie per estrarre pattern significativi da grandi volumi di dati. Le regex sono notoriamente complesse, soggette a errori e variabili tra linguaggi e librerie, il che limita di fatto l’accesso ai dati a un numero ristretto di esperti tecnici. Dynatrace affronta questo problema su due fronti. Da un lato, Log Management and Analytics powered by Grail fornisce un approccio unificato per sfruttare al meglio il valore dei dati presenti nei log con la piattaforma Dynatrace. La gestione senza problemi dei dati di log consente di acquisire petabyte di dati senza dover gestire schemi, indicizzazione o reidratazione. Tutti questi dati sono utilizzabili in qualsiasi momento per qualsiasi attività di analisi. Dall’altro, grazie alla lettura degli schemi e al linguaggio di query Dynatrace (DQL), non è necessario decidere cosa interrogare durante l’acquisizione dei dati. Proprio con Dynatrace Query Language (DQL) è proposta una sintassi a pipeline leggibile e intuitiva, più semplice e potente di SQL e delle espressioni regolari, che consente a sviluppatori e utenti business di interrogare qualsiasi dato in qualsiasi momento. Quest’ultimo ulteriormente esemplificato e potenziato grazie all’AI Generativa Dynatrace Assist che permette agli utenti di interagire con Dynatrace in linguaggio naturale. Il parsing schema-on-read, fino a dieci volte più veloce delle regex tradizionali, permette di analizzare dati storici on-demand senza dover pianificare in anticipo quali informazioni saranno necessarie. La piattaforma Dynatrace supporta nativamente oltre 800 integrazioni, da quelle con tutti i servizi Aws via Firehose al supporto OpenTelemetry, da Fluent Bit per Kubernetes con Dynatrace Operator fino alle Api per Azure e Google Cloud, garantendo copertura anche negli ambienti multicloud più eterogenei.
Un aspetto particolarmente rilevante riguarda la funzionalità dei “surrounding logs”: quando un operatore individua un log di errore, può immediatamente visualizzare tutti i messaggi correlati alla stessa transazione, basandosi sul trace ID, ricostruendo così l’intera sequenza di eventi che ha portato al problema. Questo tipo di analisi contestuale, integrata nativamente nelle app della piattaforma per infrastruttura, Kubernetes, database e cloud, riduce drasticamente il tempo medio di risoluzione degli incidenti.

I vantaggi di una piattaforma all-in-one anche nell'analisi dei log
I vantaggi di una piattaforma all-in-one anche nell’analisi dei log

L’architettura Dynatrace per il log management

Al centro dell’approccio Dynatrace al log management si colloca Grail, il data lakehouse proprietario progettato per l’osservabilità. A differenza delle architetture tradizionali basate su tier di storage differenziati, schemi rigidi e indici da gestire, Grail consente l’accesso istantaneo a petabyte di dati senza reidratazione né reindicizzazione. I log vengono ingeriti attraverso un’open pipeline che arricchisce automaticamente ogni evento con il contesto topologico rilevato da OneAgent e dalla mappa Smartscape, che traccia relazioni e dipendenze tra le entità dell’ambiente monitorato. Durante l’ingestion, la pipeline consente inoltre di mascherare dati sensibili, estrarre metriche e business events, e instradare i dati verso bucket personalizzati con politiche di retention e accesso granulari. I bucket rappresentano un meccanismo chiave per la governance dei costi e della sicurezza. Le organizzazioni possono associare periodi di retention differenti a bucket diversi – ad esempio, dati di debug con retention breve e dati di audit con conservazione pluriennale – e definire politiche di accesso sia a livello di bucket sia a livello di singolo record, allineandole a centri di costo, ruoli, ambienti o namespace Kubernetes specifici.

L’intelligenza artificiale di Dynatrace, incarnata nel motore Dynatrace Intelligence.
È la fusione tra AI deterministica e agentic AI, profondamente integrata nella piattaforma. Va pensata come un ‘sistema operativo agentico’ che scala con le esigenze, per portare avanti l’autonomia operativa e concretizzare il valore dell’AI. Questa può utilizzare agenti che sono gli elementi fondamentali della piattaforma Root Cause Agent: analizza milioni di dipendenze causali in pochi secondi — più veloce di qualsiasi combinazione di Llm — e lo fa con precisione basata sui fatti. Analytics Agent: prende volumi enormi di dati e li trasforma in informazione ricca di contesto, pulendo rumore e preparando i dati per un uso efficace da parte dell’AI. Forecasting Agent: analizza milioni di metriche e segnali su larga scala, così i team possono prevenire problemi prima che accadano. Oltre agli agenti fondamentali, Dynatrace Intelligence può orchestrare anche agenti domain-specific: progettati per i bisogni concreti di team Sre, sviluppo e security. che sanno muoversi nel contesto giusto e portare azione.

Dynatrace Intelligence opera su tre livelli complementari: l’AI causale identifica automaticamente anomalie e ne determina le cause radice con una precisione che l’azienda definisce del 100%, correlando log, tracce, eventi e metriche all’interno delle “problem card”; l’AI predittiva anticipa trend e potenziali criticità, abilitando risposte automatizzate tramite workflow; l’AI generativa consente agli utenti di creare dashboard, scrivere query Dql e analizzare contenuti di log utilizzando il linguaggio naturale. Questa combinazione, che Dynatrace definisce AI ipermodale, trasforma il log management da attività reattiva a pratica proattiva e automatizzata.

Davis consente la correlazione automatica degli eventi
Davis consente la correlazione automatica degli eventi

Risultati misurabili

I benefici dichiarati da Dynatrace trovano riscontro in analisi di terze parti. Secondo uno studio Idc (2024) i clienti Dynatrace hanno registrato un ritorno sull’investimento del 451% in tre anni, con enterprise che hanno recuperato in media 2,6 milioni di dollari per ogni 100 applicazioni supportate dalla piattaforma di osservabilità e una riduzione del 37% delle interruzioni di servizio critiche (Sev1 e Sev2), con il 56% di tempo in meno per la loro risoluzione e il 72% in meno di ricavi persi a causa di questi incidenti. Forrester, nel proprio Total Economic Impact study, evidenzia come le organizzazioni che utilizzano Dynatrace identifichino i problemi con l’80% di rapidità in più e riducano il tempo medio di risoluzione del 90%. 
In uno scenario in cui le imprese italiane ed europee accelerano l’adozione del multicloud e dell’AI, la capacità di gestire e analizzare i log in modo unificato, contestualizzato e automatizzato diventa un fattore competitivo. Non si tratta soltanto di risolvere problemi rapidamente, ma di costruire una base dati osservabile che alimenti decisioni di business, ottimizzazione dei costi e conformità normativa. L’approccio di Dynatrace al log management rappresenta, in questa prospettiva, non un semplice aggiornamento tecnologico, ma un cambio di paradigma nella governance operativa degli ambienti IT complessi. La possibilità di trasformare qualsiasi query in una metrica e da lì in un dashboard, senza reidratazione né reindicizzazione, chiude il cerchio tra osservabilità operativa e intelligence di business, offrendo ai team IT e alle linee di business uno strumento condiviso per navigare la complessità crescente dei moderni ecosistemi digitali.

Per saperne di più scarica il whitepaper: Massimizza i risultati aziendali con una gestione moderna dei log

Non perdere tutti gli approndimenti della room: AI Observability per aziende intelligenti

© RIPRODUZIONE RISERVATA

Condividi l'articolo: