Hugging Face presenta Open Computer Agent: l’AI che usa il PC al posto tuo

Controllo remoto, software open source e interfaccia grafica: ecco l’ultima sperimentazione firmata Hugging Face

Redazione

Hugging Face lancia un nuovo esperimento open source nel campo degli agenti AI: si chiama Open Computer Agent e promette di mostrare fin dove può spingersi oggi l’intelligenza artificiale nel controllare un computer quasi come farebbe un essere umano. Gratuito e accessibile direttamente da browser, questo agente virtuale permette di interagire con una macchina Linux in cloud, traducendo le richieste testuali dell’utente in azioni operative concrete.

Un agente AI che “usa il computer” al posto nostro

Open Computer Agent è progettato per eseguire comandi testuali inviati dall’utente, trasformandoli in azioni reali all’interno di un ambiente virtuale Linux. All’interno di questa macchina, l’agente può lanciare software noti come Firefox, aprire pagine web o interagire con interfacce grafiche, esattamente come farebbe una persona.

Il funzionamento ricorda da vicino Operator, il sistema sperimentale di OpenAI, ma con un’importante differenza: qui parliamo di un progetto interamente open source e accessibile tramite browser, senza necessità di installazioni locali.

Tutto avviene attraverso un’interfaccia in stile chat: si scrive il comando desiderato — ad esempio “apri Google Maps e cerca Milano” — e si osserva l’agente mentre lo esegue, simulando clic, digitazioni e interazioni varie. Si tratta di un passo in avanti nel campo degli agenti autonomi, capaci di gestire flussi di lavoro in ambienti grafici, non solo testuali.

Aymeric Roucher, del team di Hugging Face, ha spiegato su X come questo tipo di interfaccia sia reso possibile grazie ai progressi dei modelli visivi, in grado di riconoscere e localizzare elementi sullo schermo tramite coordinate. Questi modelli possono “ancorare” elementi visivi e cliccarli autonomamente, aprendo la strada a flussi di lavoro automatizzati e dinamici.

Limiti e accessibilità di Open Computer Agent

I primi test condotti da testate specializzate, come TechCrunch, segnalano tuttavia alcune limitazioni dell’agente. In particolare, Open Computer Agent può mostrare latenze significative nell’esecuzione dei comandi, soprattutto se si tratta di operazioni complesse come la ricerca e il confronto di voli aerei. Un altro ostacolo ancora insormontabile per l’agente è rappresentato dai CAPTCHA, che spesso bloccano il flusso operativo e impediscono il completamento delle azioni.

Ad oggi, l’accesso alla piattaforma è gratuito ma regolato da una coda virtuale, che può richiedere da pochi secondi a diversi minuti, a seconda dell’afflusso di utenti.

Sebbene sia ancora in fase iniziale, Open Computer Agent rappresenta a pieno titolo un elemento chiave di un mosaico più ampio: quello degli agenti AI capaci di interagire con interfacce grafiche. Un ambito in forte accelerazione, trainato dall’attenzione crescente del mondo aziendale.

Iscriviti alla newsletter

Non inviamo spam! Leggi la nostra Informativa sulla privacy per avere maggiori informazioni.