E’ occasione di confronto per sviluppatori e decision maker Google Cloud Next
Next ’24, al Mandalay Bay di Las Vegas e, come promette il nome, è il cloud il tema che tiene banco, insieme all’AI di cui è premessa architetturale necessaria. Solo l’anno scorso, in pieno hype, si cominciava appena ad immaginare come si sarebbe potuta utilizzare l’AI in azienda, “oggi questa trasformazione è ampiamente avviata e per Google la missione ultima rimane sempre la stessa, rendere l’AI utile a tutti, e fare in modo che possa migliorare la vita del maggior numero possibile di persone”. E’ così quindi che Thomas Kurian, Ceo di Google Cloud, apre i lavori.
Un passo indietro: Google oggi nel mercato cloud si trova ancora ad inseguire sia Aws, sia Microsoft, “ma cresce più velocemente degli altri” e soprattutto, con Gemini (oggi Gemini 1.5 Pro in private preview su Vertex AI), è in evidente accelerazione per quanto riguarda la proposizione GenAI. Cloud e AI sono abilitatori legati a filo doppio.
“Non c’è infatti valorizzazione possibile dell’AI senza una solida cloud infrastructure”, dettaglia Sundar Pichai, AD di Google. 36 miliardi (annual run rate) vale il cloud di Google e soprattutto cinque volte di più di cinque anni fa. Una crescita dovuta, secondo Pichai, “proprio agli importanti investimenti in AI, in particolare sulle Tpu. Senza contare poi che “il 61% delle startup che lavorano sulla GenAI poggia le proprie infrastrutture su Google Cloud, e circa il 91% degli unicorni AI è cliente Google Cloud, prosegue l’AD.

Sundar Pichai
Sundar Pichai, amministratore delegato, Google

Mercedes Benz e Goldman Sachsinvece, tra le enterprise che già hanno introdotto rispettivamente nell’esperienza di guida dei clienti e negli strumenti di analisi, per gli insights, l’AI di Google. Merita la segnalazione sul palco anche il progetto di Best Buy con Accenture, a cui è interessante aggiungere Palo Alto Networks, in quest’ultimo caso proprio per l’ambito di utilizzo nella cybersecurity.

La scalabilità effettiva dell’AI resta  un punto cardine per individuare le direzioni di sviluppo del cloud di Google.

Una scalabilità che si misura su tutto lo stack che comprende infrastruttura, Gemini, modelli e Vertex AI. Ricordiamo che Vertex AI è piattaforma di machine learning che consente di addestrare ed eseguire il deployment di modelli ML e applicazioni AI, e personalizzare i large language model da utilizzare nelle applicazioni.
Prosegue quindi la creazione di agenti AI elaborati che per esempio possono aiutare i clienti a interagire con le aziende in modo fluido lavorando su diversi canali (Web, mobile, call center e punto vendita) e in più modalità, come testo, voce e altro. I Creative Agent possono affiancare designer e team di produzione, facilitarne il lavoro su immagini e presentazioni, fornendo nuovi spunti.

Google Cloud Next ’24 è evento in cui l’evoluzione dei servizi Google Cloud per Vertex AI si tocca con mano. Con 130 modelli proprietari e di terze parti su Vertex AI l’azienda estende in modo significativo la selezione possibile del modello più adeguato. Si parla appunto di Gemini 1.5 Pro ma anche di Claude 3 con la nuova famiglia di modelli di Anthropic ora generalmente disponibile per i clienti su Vertex AI. E ancora di CodeGemma, famiglia di modelli ‘leggeri’ realizzati con la stessa tecnologia utilizzata per creare i modelli Gemini, per casi d’uso come la generazione di codice e l’assistenza al codice. Imagen 2 è invece la tecnologia text-to-image per la generazione di immagini che aiuta le aziende a creare immagini che corrispondano ai requisiti specifici del loro brand. La nuova funzionalità di text to live image consente ai team di marketing e creativi di generare immagini animate e gif, dotate di filtri di sicurezza e filigrane digitali. Inoltre, Google annuncia la disponibilità generale di funzionalità avanzate per l’editing fotografico, tra cui in e outpainting.

L’AI vicina ai dati, relazione stretta con il cloud

L’hyperscaler vuole portare l’AI più vicino al luogo in cui vengono generati e utilizzati i dati: all’edge e agli ambienti air-gapped e lo fa attraverso Google Distributed Cloud (Gdc), consentendo ai clienti di scegliere l’ambiente, la configurazione e i controlli che meglio si adattano alle esigenze specifiche.

Thomas Kurian sul palco di Google Cloud Next
Thomas Kurian, Ceo di Google Cloud, sul palco di Google Cloud Next ’24

Tra gli esempi di utilizzo del cloud ‘sovrano’, Kurian cita Orange, operatore leader di telefonia mobile che lavora in 26 Paesi e ha la necessità di conservare i dati locali all’interno degli specifici confini nazionali e sfrutta l’AI su Gdc per migliorare le prestazioni della rete e ottimizzare l’esperienza dei clienti”.

Tra le novità negli sviluppi, l’introduzione delle Gpu Nvidia in Gdc supportando sia configurazioni connesse che air-gapped per l’esecuzione efficiente dei modelli di intelligenza ma anche una serie di modelli di intelligenza artificiale aperti, tra cui Gemma, Llama e altri ancora, per l’esecuzione in ambienti edge, air-gapped e connessi.

Sovereign cloud è un tema che ritorna poi nei keynote, perché Google ha l’esigenza di conquistare quote maggiori anche in Europa, dove la sensibilità sul problema è più elevata. L’hyperscaler fornisce Google Distributed Cloud quindi in una configurazione completamente air-gapped sia direttamente gestita sia gestibile dai partner, ma lasciando alle aziende il controllo completo e, in caso di modifiche alle normative, quanto serve alle imprese per adeguarsi rapidamente.
Non tutti i carichi di lavoro riguardano l’AI, ed ogni carico eseguito in cloud necessita di ottimizzazione con ogni applicazione che presenta esigenze tecniche specifiche, da qui la scelta di introdurre nuove opzioni di calcolo per consentire ai clienti di massimizzare le prestazioni, abilitare l’interoperabilità tra le applicazioni e raggiungere gli obiettivi di sostenibilità, il tutto riducendo i costi.

Sempre riguardo il tema della sovranità su dati e workload, Kurian sottolinea “l’estensione della residenza dei dati archiviati a riposo per l’AI generativa sui servizi Vertex AI in 11 nuovi Paesi, tra cui anche l’Italia, con la possibilità di limitare l’elaborazione del machine learning anche solo in UE (oppure negli Usa) quando si utilizza Gemini 1.0 Pro e Imagen“. Significa disporre di un maggiore controllo su dove vengono archiviati i dati, sulle modalità di accesso, facilitando il rispetto dei requisiti normativi e di sicurezza.

L’evoluzione specifica nella proposizione di AI generativa poggia sul potenziamento infrastrutturale, abbiamo visto. Google mette a disposizione quindi la nuova istanza A3 mega sviluppata con Nvidia sfruttando le Gpu Tensor Code H100, per larghezza di banda doppia rispetto alle istanze classiche A3. La proposta Confidential A3 consente ai clienti di proteggere al meglio la riservatezza e l’integrità dei dati sensibili e dei carichi di lavoro AI durante il training e l’inferenza. Google vuole introdurre all’inizio del 2025, nuovi chip della piattaforma Nvidia Blackwell, progettati per migliorare il training e i servizi mainstream, l’inferenza in tempo reale di modelli linguistici di grandi dimensioni e le prestazioni di training su scala massiva.
E’ già disponibile invece Tpu v5p, l’acceleratore AI per il training e l’inferenza e, insieme, il supporto di Google Kubernetes Engine (Gke). Migliorano infine le opzioni di archiviazione per conservare i dati in prossimità della Tpu o della Gpu del cliente. E con Hyperdisk ML (in anteprima), è proposto un servizio di archiviazione a blocchi di nuova generazione che accelera i tempi di caricamento dei modelli fino a 3,7 volte rispetto alle soluzioni più diffuse.

Google, l’AI per sicurezza e Workspace

Non si vogliono certo esaurire così i temi sulle novità presentate ma tra quelli più importanti la selezione ci porta infine a considerare i passi in avanti per quanto riguarda l’utilizzo dell’AI al servizio della sicurezza e in Google Workspace. “L’AI generativa, spiega Kurian nel suo blog, ha il potenziale per spostare l’ago della bilancia a favore dei difensori, grazie ai Security Agent che forniscono assistenza in ogni fase del ciclo di vita della sicurezza. Le innovazioni presenti nel portfolio di sicurezza di Google Cloud, garantiscono risultati più efficaci e consentono a tutte le aziende di includere Google come parte del proprio team di sicurezza”. Ora comprendono Gemini in Threat Intelligence che utilizza il linguaggio naturale per fornire insight approfonditi sul comportamento degli attori delle minacce. In questo modo è possibile analizzare campioni molto grandi di codice potenzialmente dannosi. La finestra di contesto di Gemini, ora ulteriormente estesa, consente di analizzare le interazioni tra i moduli, fornendo nuove informazioni sul vero intento del codice. La funzione Gemini in Security Operations è di ricerca assistita ed in grado di convertire il linguaggio naturale in rilevamenti, riassumere i dati relativi agli eventi, consigliare le azioni da intraprendere e guidare gli utenti all’interno della piattaforma tramite una chat conversazionale.
Restiamo nell’ambito della sicurezza – ma rappresenta l’aggancio per Google Workspace – la possibilità per gli admin di Workspace di classificare e proteggere automaticamente i file e i dati sensibili utilizzando modelli di AI che preservano la privacy e controlli per la prevenzione della perdita dei dati adattati alla propria azienda (anche in questo caso il servizio è a pagamento e si integra nei diversi piani Workspace). 

Google Vids in azione
Google Vids in azione

Infine, per quanto riguarda Gemini e l’integrazione con le app Workspace, Google procede con l’introduzione di un agente AI innestato in Gmail, Documents, Sheets, ma arriva anche Google Vids come applicazione per la creazione di video in ambito professionale. Si tratta di un assistente per la scrittura, la produzione e l’editing di video, tutto in un’unica soluzione. Può generare uno storyboard facilmente modificabile e, dopo aver scelto uno stile, sviluppa una prima bozza con scene selezionate da video di repertorio, immagini e musica di sottofondo. Per riunioni e messaggistica, ma a pagamento, arriva un componente aggiuntivo che comprende sintesi delle chat e traduzione in tempo reale in 69 lingue. 

© RIPRODUZIONE RISERVATA

Condividi l'articolo: