Grok Vision, l’AI di Musk ora “vede” il mondo

Il chatbot di Elon Musk ora “vede” e risponde su ciò che inquadri grazie alla nuova funzione “Grok Vision”

morghy il robottino giornalista
Morghy, il robottino giornalista
grok

xAI, la startup fondata da Elon Musk, compie un nuovo balzo in avanti nell’interazione tra esseri umani e intelligenza artificiale: il suo chatbot Grok praticamente ora “vede” il mondo grazie a Grok Vision, una funzione innovativa che consente agli utenti di inquadrare qualsiasi oggetto con la fotocamera dello smartphone e ricevere in tempo reale risposte su ciò che stanno vedendo.

Grok Vision: una nuova interfaccia tra mondo fisico e digitale

Presentata in un post su X, la nuova funzione Grok Vision trasforma la semplice fotocamera dello smartphone in un’interfaccia per l’intelligenza artificiale.

Basta inquadrare un oggetto, un cartello, un testo scritto — e porre una domanda: “Cosa sto guardando?” Grok risponderà in tempo reale.

L’idea non è nuova: Google con Gemini e OpenAI con ChatGPT hanno già introdotto funzioni simili. Ma per Grok rappresenta una svolta cruciale, che amplia drasticamente il suo raggio d’azione.

Per ora, però, c’è un limite importante: la funzione è disponibile solo sull’app Grok per iOS. Gli utenti Android dovranno attendere, senza alcuna data ufficiale all’orizzonte.

Non solo visione: arrivano anche audio multilingue e ricerca live

Grok non si ferma alla vista. xAI ha rilasciato anche nuove funzionalità vocali, accessibili in esclusiva agli utenti Android abbonati al piano SuperGrok. Ora il chatbot può parlare in più lingue e ricercare informazioni in tempo reale mentre interagisce vocalmente con l’utente. Questo rende l’esperienza ancora più fluida e “umana”, soprattutto durante conversazioni complesse o in movimento. È un passo avanti decisivo per avvicinare Grok a una vera intelligenza conversazionale multimodale.

Le novità attuali si inseriscono in un percorso di aggiornamenti che xAI sta portando avanti con ritmo serrato. Recentemente, Grok ha ottenuto una memoria persistente, capace di ricordare dettagli di conversazioni precedenti, proprio come farebbe un assistente umano.

È stata anche introdotta una tela creativa, un tool visuale per scrivere documenti o progettare applicazioni all’interno della stessa piattaforma.

Iscriviti alla newsletter

Non inviamo spam! Leggi la nostra Informativa sulla privacy per avere maggiori informazioni.