Gemini 2.5 Flash Image, per l’editing e la generazione di immagini

Google ha annunciato Gemini 2.5 Flash Image, il suo modello di punta per la generazione e l’editing di immagini. Conosciuto anche con il nome in codice nano-banana, questo strumento introduce funzionalità avanzate che puntano a rendere più fluido e creativo il lavoro di sviluppatori, designer e aziende. L’obiettivo è rispondere ai feedback ricevuti dopo il lancio di Gemini 2.0 Flash, migliorando la qualità delle immagini e offrendo un controllo più preciso sui contenuti generati.

Gemini 2.5 Flash Image, le nuove funzionalità del modello

Gemini 2.5 Flash Image consente di fondere più immagini in una sola, mantenere la coerenza dei personaggi in diversi contesti e realizzare trasformazioni mirate tramite comandi in linguaggio naturale. Una delle sfide principali dell’AI visiva è infatti preservare l’identità di un soggetto, e ora il modello permette di collocarlo in ambienti diversi senza alterarne l’aspetto. Ciò apre possibilità che spaziano dalla creazione di asset per brand coerenti fino alla realizzazione di cataloghi di prodotti da più angolazioni.

Uno dei punti di forza di Gemini 2.5 Flash Image è la modifica locale mirata. È possibile, ad esempio, rimuovere un oggetto indesiderato da una foto, alterare un’espressione o aggiungere colore a un’immagine in bianco e nero, tutto semplicemente descrivendo l’azione con il linguaggio naturale. Questa precisione consente di passare da un’idea al risultato finale in pochi istanti, riducendo drasticamente i tempi di lavoro creativo.

La possibilità di combinare più immagini in un’unica scena arricchisce ulteriormente il potenziale applicativo. Dalla progettazione di interni al marketing digitale, Gemini 2.5 Flash Image si propone come uno strumento versatile, pronto a diventare un riferimento per chi cerca velocità, qualità e libertà creativa.

Un’altra innovazione significativa riguarda l’uso della conoscenza del mondo integrata in Gemini. Questo consente di generare immagini non solo esteticamente curate, ma anche semanticamente coerenti con la realtà. Attraverso template già pronti in Google AI Studio, gli sviluppatori possono creare app educative che interpretano schemi disegnati a mano o applicazioni per l’editing fotografico che modificano pose, sfondi o colori con un semplice prompt.

Accessibilità e strumenti per sviluppatori

Il modello è già disponibile tramite Gemini API, Google AI Studio e Vertex AI per le imprese. Il prezzo è fissato a 30 dollari per 1 milione di token in output, con un costo di circa 0,039 dollari per immagine. All’interno di Google AI Studio, la modalità build è stata aggiornata per consentire test rapidi e personalizzazioni, fino alla possibilità di salvare i progetti direttamente su GitHub.

Per facilitare l’adozione, Google ha realizzato applicazioni dimostrative che mostrano le capacità del modello: dalla fusione di più immagini alla creazione di mockup per il settore immobiliare o badge aziendali. Inoltre, grazie alla collaborazione con OpenRouter.ai e fal.ai, la tecnologia verrà resa disponibile a una comunità ancora più ampia di sviluppatori.

Un aspetto importante riguarda la tracciabilità: tutte le immagini generate o modificate con Gemini 2.5 Flash Image conterranno infatti una filigrana digitale invisibile (SynthID), che ne certifica l’origine AI.

Gemini 2.5 Flash Image, il nuovo modello AI per l’editing e la generazione di immagini

Gemini 2.5 Flash Image, le nuove funzionalità del modello

Accessibilità e strumenti per sviluppatori

Iscriviti alla newsletter

Gemini 2.5 Flash Image, le nuove funzionalità del modello

Accessibilità e strumenti per sviluppatori

Iscriviti alla newsletter

Articoli correlati