Apple Vision Pro potrebbe leggere il labiale: la novità da un brevetto

Un brevetto firmato Apple svela una nuova funzione del Vision Pro per interpretare comandi senza emettere suoni, soltanto attraverso il labiale

Redazione
apple

Immaginate di poter comunicare con un assistente vocale senza emettere alcun suono, semplicemente muovendo le labbra. Apple ha brevettato una tecnologia rivoluzionaria che potrebbe rendere tutto questo realtà, portando l’interazione con il visore Vision Pro a un livello di discrezione e funzionalità mai visto prima. Un brevetto svelato di recente descrive un sistema complesso e sofisticato per interpretare i comandi vocali senza bisogno di parlare ad alta voce.

Un sistema multisensore per leggere il labiale e i movimenti del viso

Individuato da Apple Insider, il brevetto (dal titolo “Dispositivo elettronico con struttura per la dettatura”) prevede una serie di sensori integrati nella montatura del visore Apple Vision Pro.

Non si tratterebbe di una semplice telecamera, ma di un sistema che combina più elementi tecnologici: un sensore visivo orientato verso il basso per catturare i movimenti della bocca, un sensore aggiuntivo per rilevare vibrazioni o deformazioni facciali, e persino telecamere interne ed esterne.

Quest’ultime non solo seguirebbero lo sguardo dell’utente (eye-gaze), ma riconoscerebbero anche gesti manuali per attivare o interrompere la dettatura silenziosa.

Questo complesso intreccio di dati permette di tradurre in testo i movimenti labiali in modo molto più preciso e personalizzato rispetto alle tecnologie attuali, rendendo la comunicazione con il dispositivo invisibile e assolutamente discreta.

L’idea alla base del brevetto non è del tutto nuova per Apple. La casa di Cupertino ha già introdotto interazioni basate sui movimenti del corpo, come negli AirPods Pro, che permettono di accettare o rifiutare chiamate con un semplice annuire o scuotere della testa. Questa nuova tecnologia rappresenta però un salto di qualità, con l’obiettivo di integrare la dettatura silenziosa direttamente nel Vision Pro.

Addestrare l’intelligenza artificiale per ogni voce e ogni sussurro

Una delle sfide principali di questa tecnologia è l’adattamento al modo unico in cui ognuno muove le labbra e produce i suoni. Il brevetto spiega che il sistema verrà allenato con dati audio e video registrati in condizioni variabili: dal parlato normale, con volumi tra i 40 e i 70 decibel, al sussurro, tra i 20 e i 50 decibel. Queste registrazioni cattureranno la bocca da molteplici angolazioni, permettendo all’AI di riconoscere con precisione anche i movimenti più lievi e personalizzati di ogni utente.

In questo modo, la dettatura silenziosa non sarà solo un esperimento tecnologico, ma una funzionalità affidabile, calibrata sulle peculiarità individuali, capace di funzionare anche in ambienti rumorosi o in contesti dove parlare ad alta voce è semplicemente impossibile.

Iscriviti alla newsletter

Non inviamo spam! Leggi la nostra Informativa sulla privacy per avere maggiori informazioni.