Google continua ad aggiornare il suo assistente IA, Gemini, introducendo nuove funzionalità che migliorano l’interazione con gli utenti e aprono nuove opportunità per gli sviluppatori. Tra le novità principali troviamo una nuova opzione di condivisione immagini e l’espansione di Gemini Nano. Inoltre, il lancio della versione 1.5 Pro-002 promette miglioramenti significativi in termini di capacità di ragionamento, matematica e programmazione.
Condivisione di immagini con Gemini
Una delle principali novità è la possibilità di condividere immagini direttamente con Gemini attraverso il menu di condivisione di Android. Questa funzione, disponibile nell’ultima versione dell’app, permette agli utenti di inviare un’immagine all’assistente e porre immediatamente domande a riguardo, affiancandosi così ai metodi tradizionali come la cattura dello schermo o l’allegamento manuale di immagini.
Il vantaggio principale della nuova opzione è la sua praticità. Gli utenti possono condividere rapidamente immagini senza dover scaricare file o accumulare screenshot inutili.
Per saperne di più: Intelligenza artificiale: cos’è e come funziona, tutto sulla AI
Gemini Nano, la “mini” AI di Google direttamente sui dispositivi
Un’altra importante novità riguarda Gemini Nano, la versione on-device dell’intelligenza artificiale di Google. Ora, gli sviluppatori possono integrare Gemini Nano nelle loro applicazioni, consentendo l’uso dell’AI direttamente sui dispositivi mobili. Al momento, questa funzione è limitata a dispositivi Android di fascia alta, come la serie Pixel 9 e la famiglia Galaxy S24, ma Google prevede un’espansione a un numero maggiore di dispositivi nei prossimi mesi.
Il vantaggio di Gemini Nano è che funziona interamente sul dispositivo, garantendo maggiore velocità e privacy. Gli sviluppatori possono iniziare a sperimentare con Gemini Nano utilizzando il Google AI Edge SDK, anche se per il momento è richiesto un Pixel 9 per lo sviluppo. Sebbene attualmente siano supportati solo prompt testuali, Google ha annunciato che in futuro saranno possibili interazioni più complesse, inclusa la gestione di immagini.
L’espansione di Gemini 1.5 Pro-002: più potenza per i professionisti
L’aggiornamento più significativo riguarda il lancio di Gemini 1.5 Pro-002, disponibile per gli abbonati al servizio Pro, e per gli sviluppatori in due nuovi modelli 1.5 Pro-002 e 1.5 Flash-002.
Questa nuova versione introduce miglioramenti notevoli, con un aumento del 7% nelle capacità di ragionamento, del 20% nelle competenze matematiche e un potenziamento nelle capacità di programmazione.
Le nuove funzionalità includono anche la possibilità di:
- partecipare a discussioni etiche approfondite;
- risolvere problemi matematici complessi;
- accedere a nuove modalità di interazione.
Google ha inoltre migliorato le capacità multimodali di Gemini 1.5 Pro, rendendolo uno strumento più efficace per compiti che includono la sintesi di informazioni da documenti estesi o la creazione di contenuti da video lunghi.