Facebook sembra aver esaurito la sua spinta propulsiva di crescita e Mark Zuckerberg è ora impegnato nella sfida ben più ambiziosa della costruzione del metaverso. Il cambio di passo, segnato dalla costituzione di Meta, a novembre – ad indicare anche la direzione verso cui far convergere gli sforzi dello sviluppo – è legato a filo doppio alla creazione di nuovi sistemi in grado di sfruttare l’intelligenza artificiale come digital enabler chiave per la costruzione dei nuovi ambienti.
Per questo, in occasione dell’evento Inside The Lab: Costruire il metaverso con l’AI, lo stesso Zuckerberg “scende in campo”, declina strategia di sviluppo e intenti nella creazione del metaverso ed allo stesso tempo rivendica la bontà degli investimenti compiuti in passato in questi ambiti, a vantaggio della nuova proposizione. “Oggi, possiamo fare questo lavoro sul metaverso – spiega Zuckerberg grazie agli investimenti a lungo termine che abbiamo iniziato a fare nell’intelligenza artificiale e nella realtà virtuale quasi un decennio fa. Le scoperte che stiamo vivendo ora nel campo dell’AI sono state raggiunte grazie ad investimenti a lungo termine nel campo dell’apprendimento auto-supervisionato, che abbiamo fatto sin dai primi giorni di vita dei nostri laboratori di ricerca”.

Mark Zuckerberg
Mark Zuckerberg, Ceo di Meta

A impressionare di più, dal punto di vista della “vision” è però il riferimento al balzo in avanti proposto proprio nell’utilizzo dell’AI che, se fino ad oggi è stata utilizzata soprattutto per la comprensione del mondo fisico e per anticipare gli eventi in modo da farsi trovare preparati nella risposta, sarà utilizzata nel metaverso “per aiutare le persone a navigare nei mondi virtuali, così come nel nostro mondo fisico, con la realtà aumentata”.

In un mondo dinamico e in continuo cambiamento come il metaverso poi “l’AI dovrà essere in grado di comprendere il contesto e imparare, proprio come fanno gli umani”. L’aspetto più interessante riguarda la possibilità di “incorporare la conoscenza in ogni possibile forma  – testo, discorso, movimento, posizione, linguaggio del corpo, tutte le informazioni che vengono catturate attraverso i sensori”. Con la possibilità quindi di accelerare training e conseguente apprendimento sulla base di una gamma diversificata di input. Ma soprattutto con un’interessante evoluzione nel metodo che punta in modo ancora più consistente sull'”inferenza”. Spiega infatti Zuckerberg: “L’idea di base è che non è necessario insegnare all’AI concetti specifici, basta darle dati grezzi e chiederle di prevedere le parti mancanti, e strada facendo imparerà le rappresentazioni astratte”.

Il Ceo parla quindi anche di “apprendimento auto-supervisionato” come metodo di allenamento dell’AI persino nella comprensione del testo naturale, cui conta di raggiungere presto risultati importanti proprio per quanto riguarda le immagini e altri tipi di dati, sulla base per cui questo sistema “è migliore di molti altri metodi per immagini e video, compresi modelli che si basano su milioni di dati preimpostati”.

I progetti

A parte la breve demo su Builder Bot – permette alle persone di generare o importare elementi nel mondo virtuale attraverso comandi vocali – in particolare sono due i passaggi chiave nel keynote di Zuckerberg che meglio introducono anche i progetti più interessanti presentati.

Project Cairoke
Meta Project Cairoke

Gli sforzi per consentire alle persone di accedere a Internet ed in futuro al metaverso catapultandosi nei mondi virtuali per fare esperienze con le altre persone utilizzando sempre la propria lingua – di fatto permettendo alle persone di comunicare indipendentemente dalla scelta linguistica – e l’impegno a sviluppare esperienze di interazione con assistenti virtuali e chatbot con l’AI quanto più vicini possibili alle esperienze reali di interscambio tra le persone. E’ questo il progetto Cairaoke, nato per sviluppare un modello neurale end-to-end in grado di sostenere conversazioni più personali e contestuali rispetto ai sistemi che le persone conoscono oggi. Modello già applicato da Meta in uno dei prodotti, Portal, e ora in fase di integrazione con dispositivi di realtà aumentata e virtuale per consentire interazioni multimodali immersive con gli assistenti virtuali.

L’AI per la traduzione universale istantanea

Entriamo, invece, nei dettagli di due dei progetti interessanti per quanto riguarda la comprensione linguistica. Con No Language Left Behind, Meta lavora per costruire un nuovo modello di intelligenza artificiale avanzato in grado di apprendere dalle lingue che dispongono di meno esempi da usare per l’addestramento. Sarà utilizzato per traduzioni di qualità professionale in centinaia di lingue, non le poche decine di lingue attuali attraverso cui è possibile oggi fare le traduzioni. Il secondo progetto è Universal Speech Translator, nell’ambito del quale Meta sta lavorando a nuovi approcci per tradurre in tempo reale il testo parlato da una lingua a un’altra, in modo da poter supportare sia le lingue prive di un sistema di scrittura standard, sia quelle scritte e parlate. E questo merita senza dubbio un ulteriore approfondimento.

Meta - sistemi di traduzione
Meta – Il 20% della popolazione mondiale non dispone di sistemi di traduzione commerciale

E’ riconosciuto come i sistemi di traduzione disponibili oggi non siano progettati per servire le migliaia di lingue utilizzate in tutto il mondo o per fornire la traduzione vocale in tempo reale. Soprattutto in tanti casi il limite è dato dal necessario “passaggio” attraverso la lingua inglese per le traduzioni. Per esempio, Meta lavora su tecniche tecniche di creazione automatica di set di dati per rendere possibili le traduzioni in lingue con poche risorse e creare gli elementi di base per traduzioni future in un numero maggiore di lingue scritte o parlate, indipendentemente dalla loro diffusione.

Una di queste tecniche è Laser, set di strumenti open source in grado di convertire le frasi di varie lingue in un’unica rappresentazione multilingue. La ricerca poi sulla similarità multilingue su vasta scala aiuta a identificare le frasi che hanno una rappresentazione simile, cioè quelle che è probabile che abbiano lo stesso significato in lingue diverse e questo accelera la traduzione.

Tecnologie per la traduzione
I passi in avanti delle tecnologie di traduzione

Gli sviluppi più recenti ora vedono l’utilizzo di Laser esteso al parlato. In particolare, spiegano gli esperti di Meta: “la creazione di rappresentazioni per il parlato e per il testo nello stesso spazio multilingue, consente di estrarre traduzioni tra il parlato in una lingua e il testo in un’altra, o persino traduzioni vocali dirette. Grazie a questo metodo, abbiamo già identificato quasi 1.400 ore di testo parlato allineato in francese, tedesco, spagnolo e inglese”. Passi avanti compiuti sviluppando un sistema di traduzione vocale che non si basa sulla generazione di una rappresentazione testuale intermedia durante l’inferenza, e lavorando anche sui sistemi di verifica della bontà dei modelli che in Meta oggi si basa su Flores-101 che consente ai ricercatori di quantificare le prestazioni dei sistemi attraverso qualsiasi direzione linguistica, e quindi non solo traducendo da e verso l’inglese.

© RIPRODUZIONE RISERVATA

Condividi l'articolo: