Facebook alza l’asticella della computer vision grazie a Instagram

Sara Giannaccini
Facebook

Facebook ha creato Seer, un programma che capace di “vedere” cosa c’è in una foto, grazie a immagini casuali reperite da Instagram.


Con il passare degli anni, Instagram è diventato uno dei più grandi database di immagini alimentato dagli utenti al mondo, con tanto di categorizzazione e geolocalizzazione degli elementi. 

Una mole di dati di valore inestimabile il cui potenziale non è certo passato inosservato a Facebook, proprietario del social di fotografia, che starebbe usando questo vero e proprio tesoro per insegnare alle macchine che cosa c’è in una foto.

Come riporta CNBC, Facebook ha annunciato in un blogpost di aver costruito un programma di intelligenza artificiale che può “vedere” ciò che sta guardando, alimentando il sistema di machine learning con oltre un miliardo di immagini pubbliche reperite proprio da Instagram.

Il programma di “computer vision”, soprannominato Seer, avrebbe addirittura avuto performance maggiori rispetto ai modelli AI esistenti in un test di riconoscimento dell’oggetto, ha detto Facebook. Il programma avrebbe infatti raggiunto un “punteggio di accuratezza della classificazione” dell’84,2% quando ha tentato un test fornito da ImagEnet, un grande database visivo progettato per l’uso nella ricerca software di riconoscimento visivo degli oggetti. Di base, questo sistema verifica se un programma AI può identificare cosa c’è in una foto.

Il nuovo approccio di Facebook

Considerando che molti modelli AI sono addestrati su set di dati accuratamente etichettati, Facebook ha riferito che Seer ha imparato come identificare gli oggetti nelle foto analizzando immagini Instagram casuali, prive di etichetta. Questa tecnica di addestramento dell’intelligenza artificiale è conosciuta come apprendimento auto-supervisionato, self-supervised (da qui deriva Seer: SElf-SupERvised).

Il futuro dell’intelligenza artificiale risiede nella creazione di sistemi che possono imparare direttamente da qualsiasi informazione fornita, sia che si tratti di testo, immagini o di un altro tipo di dati – senza fare affidamento su set di dati accuratamente protocollati ed etichettati“, hanno scritto i ricercatori di Facebook in un post sul blog aziendale.

La performance di Seer dimostra che l’apprendimento auto-supervisionato può eccellere nelle attività di computer vision con le impostazioni afferenti al mondo reale“, hanno aggiunto. “Questa è una svolta che alla fine spiana il percorso per modelli di visione informatica più flessibili, accurati e adattabili in futuro“.

Mentre questo è solo un progetto di ricerca, da Facebook fanno sapere che gli usi potenziali sono relativamente ampi. Tra questi, un miglioramento dei testi generati automaticamente per descrivere le immagini in ottica accessibilità per le persone con disabilità visive, una migliore categorizzazione automatica degli articoli venduti sul Marketplace di Facebook e migliori sistemi per evitare il diffondersi di immagini pericolose sulla piattaforma.

E la privacy?

Gli utenti di Instagram potrebbero essere sorpresi di sapere che le loro immagini vengono utilizzate per addestrare i sistemi di intelligenza artificiale di Facebook.

Informiamo i titolari di account Instagram tramite la nostra privacy policy riguardo l’utilizzo di queste informazioni per supportare ricerca e innovazione” ha detto a CNBC Priya Goyal, un ingegnere software presso Facebook AI Research.

Facebook ha detto che il suo software avrà una logica open source in modo che altri ricercatori possano sperimentarlo.

“Mentre condividiamo i dettagli della nostra ricerca creiamo una libreria di open source che consentirà ad altri ricercatori di utilizzare l’apprendimento auto-supervisionato per formare modelli su immagini non categorizzate, non condividiamo le immagini o la modalità Seer”, ha detto Goyal.