La realtà aumentata ora anticipa lo sguardo

Nuovi sistemi AR prevedono i movimenti oculari degli utenti per creare esperienze immersive più rapide e naturali

Redazione
Visore AR con 3d gaze forecasting che anticipa la direzione dello sguardo

La tecnologia della 3D gaze forecasting potrebbe cambiare radicalmente il futuro della realtà aumentata. I nuovi sistemi sviluppati nel settore AR promettono infatti di prevedere in anticipo dove l’utente rivolgerà lo sguardo, consentendo ai dispositivi di reagire prima ancora che l’azione venga compiuta. Un passo avanti significativo rispetto agli attuali smart glasses, che oggi si limitano a rispondere ai movimenti oculari soltanto dopo che questi sono avvenuti.

Alla base di questa innovazione c’è il lavoro di Fiona Ryan, dottoranda della Georgia Tech School of Interactive Computing, che ha presentato uno studio dedicato alla previsione tridimensionale dello sguardo durante la conferenza IEEE CVPR di Denver. La ricerca introduce un approccio completamente nuovo: invece di analizzare immagini statiche in 2D, il sistema ricostruisce il percorso dell’attenzione umana all’interno di ambienti tridimensionali dinamici.

Secondo i ricercatori, questa capacità permetterà ai futuri dispositivi AR di preparare in anticipo contenuti e scene digitali, offrendo esperienze molto più fluide e immersive.

Principio della 3D gaze forecasting nei sistemi AR

La 3D gaze forecasting si fonda sull’analisi del movimento oculare all’interno di uno spazio tridimensionale. A differenza dei tradizionali sistemi di eye tracking bidimensionale, il nuovo metodo considera il fatto che le persone si muovono continuamente in ambienti reali, osservando oggetti da prospettive differenti.

Il sistema sviluppato da Ryan utilizza dati raccolti attraverso il dataset Meta Aria Digital Twin, una piattaforma che contiene registrazioni in prima persona di utenti impegnati in attività quotidiane all’interno di un appartamento ricostruito digitalmente in alta precisione. Grazie a questa ricostruzione 3D, i ricercatori riescono a seguire l’intersezione tra lo sguardo umano e l’ambiente circostante.

L’obiettivo è comprendere il cosiddetto “percorso dell’attenzione”, cioè la sequenza di punti su cui l’occhio si concentra durante un’azione. Se una persona prende una tazza da un tavolo, ad esempio, il sistema può prevedere quale sarà il punto osservato immediatamente dopo. La previsione dello sguardo diventa quindi un indicatore delle intenzioni dell’utente, migliorando l’interazione tra mondo fisico e contenuti digitali.

Come il 3D gaze forecasting ottimizza la resa visiva

Uno degli aspetti più interessanti della tecnologia riguarda la capacità dei dispositivi AR di anticipare il rendering delle scene. Oggi i visori reagiscono ai movimenti oculari in tempo reale, ma con inevitabili ritardi di elaborazione. La previsione tridimensionale introduce invece un approccio proattivo.

Secondo lo studio, il software riesce a prevedere la direzione dello sguardo fino a tre secondi nel futuro, arrivando in alcuni casi anche a dieci secondi. Questo intervallo temporale è sufficiente per permettere al sistema di preparare in anticipo gli elementi grafici che l’utente probabilmente osserverà.

Di conseguenza, l’esperienza risulta più naturale e continua. Le immagini vengono caricate prima che l’utente le guardi realmente, riducendo latenze, scatti e rallentamenti. Il vantaggio è evidente soprattutto in applicazioni immersive come gaming, simulazioni professionali o ambienti di formazione avanzata.

La previsione dello sguardo contribuisce inoltre a migliorare l’efficienza energetica dei dispositivi. I processori grafici possono concentrare la potenza di calcolo soltanto sulle aree che saranno osservate, evitando sprechi di risorse e ottimizzando i consumi.

Impatto sull’esperienza utente e interazione immersiva

L’integrazione della 3D gaze forecasting potrebbe ridefinire il concetto stesso di esperienza immersiva. Quando il sistema riesce ad anticipare le intenzioni visive dell’utente, l’interfaccia diventa più reattiva e intuitiva.

Le informazioni compaiono nel momento esatto in cui servono, senza tempi morti o attese percepibili. Questo meccanismo rafforza la sensazione di continuità tra ambiente reale e contenuto digitale, uno degli obiettivi principali della realtà aumentata moderna.

La ricerca evidenzia inoltre che lo sguardo umano segue schemi legati alle attività svolte. Durante un’azione quotidiana, gli occhi tendono a fissarsi su elementi funzionali all’obiettivo successivo. Comprendere questi schemi significa offrire interazioni molto più precise e personalizzate.

L’utente non si limita più a controllare il dispositivo: è il dispositivo che inizia a comprendere le intenzioni dell’utente, adattando l’esperienza in tempo reale.

Tecnologie simili e differenze nei sistemi di previsione

Negli ultimi anni numerose aziende hanno sviluppato sistemi di eye tracking per la realtà aumentata e virtuale, ma la maggior parte delle soluzioni disponibili si basa ancora su modelli bidimensionali.

Il lavoro presentato dalla Georgia Tech introduce invece una componente tridimensionale che amplia enormemente la precisione delle previsioni. Non si tratta soltanto di capire quale punto dello schermo venga osservato, ma di interpretare il movimento dello sguardo nello spazio reale.

Questa differenza consente ai dispositivi di comprendere meglio il contesto e anticipare in modo più accurato le azioni future dell’utente. Inoltre, il nuovo approccio può essere combinato con altri sistemi predittivi già utilizzati nell’ambito AR, migliorando la sincronizzazione tra software, sensori e hardware grafico.

La tecnologia supera così i limiti della semplice tracciatura della retina, introducendo un modello più vicino al funzionamento naturale della percezione umana.

Prospettive future per la 3D gaze forecasting in AR

La ricerca rappresenta per ora una prova di concetto, ma le prospettive future appaiono estremamente ampie. Fiona Ryan ha spiegato che i modelli potrebbero evolversi integrando scenari differenti e informazioni contestuali sulle attività svolte dall’utente.

Se il sistema comprende cosa una persona sta cercando di fare, infatti, può restringere le possibilità e prevedere con maggiore precisione il percorso dello sguardo. Questo potrebbe portare alla nascita di smart glasses molto più intelligenti, capaci di accompagnare l’utente con suggerimenti e contenuti dinamici perfettamente sincronizzati con le sue azioni.

Gli sviluppi futuri potrebbero interessare anche il settore della robotica. Analizzando il comportamento visivo umano durante l’esecuzione di compiti specifici, gli algoritmi potrebbero insegnare ai robot a replicare gli stessi processi percettivi.

Fonte: TechXplore

Iscriviti alla newsletter

Non inviamo spam! Leggi la nostra Informativa sulla privacy per avere maggiori informazioni.