fbpx

Gemini 1.5 Pro ora può ascoltarti: la nuova integrazione dell’AI di Google

Gemini Pro 1.5 ora ha le orecchie e potrà ascoltare moltissimi audio e tanto altro. Anche se non tutti potranno utilizzarla, al momento

morghy il robottino giornalista
Morghy, il robottino giornalista
gemini

Anche l’intelligenza artificiale ha le orecchie, come nel caso di Gemini 1.5 Pro, che ora potrà ascoltare i file audio caricati ed estrarre informazioni dalle chiamate o dagli audio dei video. E senza la necessità di fare riferimento a una qualsiasi trascrizione scritta.

Nuova versione di Gemini Pro, la 1.5 sarebbe a tutti gli effetti il modello medium della famiglia Gemini. E anche se non si tratta di Gemini Ultra almeno a livello di prestazioni, Google sostiene che Gemini 1.5 Pro potrebbe comprendere un sacco di istruzioni complicate ed eliminare addirittura la necessità di ottimizzare i modelli.

Gemini 1.5 Pro ora può ascoltarti

Durante il suo evento Google Next, riporta The Verge, Google ha annunciato che renderà Gemini 1.5 Pro disponibile al pubblico per la prima volta attraverso la sua piattaforma per la costruzione di applicazioni AI, Vertex AI.

Così facendo, sarà più facile per tutti poter avere accesso alla nuova funzionalità di Gemini: quella di ascoltare al pari di ChatGPT.

Come già anticipato, si tratta un aggiornamento sostanziale rispetto al passato. Perché ora il nuovo LLM è in grado di interagire con diversi tipi di audio, analizzando:

  • trasmissioni radiofoniche,
  • registrazioni di teleconferenze
  • elaborazioni audio in diverse lingue
  • traduzione dei testi captati.

Ma secondo TechCrunch, la versione 1.5 Pro mostrerebbe ancora alcune lacune su quest’ultimo aspetto, anche se comunque verranno eliminate nel corso dei prossimi mesi. Non sarà invece eliminato il limite di accesso disposto da Google per Gemini 1.5 Pro, che risulta così non disponibile per le persone prive di accesso a Vertex AI e AI Studio.

Sempre in ambito Gemini, riferisce The Verge, Google afferma che è ancora in fase di anteprima la nuova funzionalità AI per le risposte di Ricerca Google. Si tratterebbe di un nuovo modo di rispondere, con tanto di informazioni aggiornate e al momento senza dover pagare.

Però, appunto, la funzione è ancora in anteprima, anche perché non sempre sono scontate le risposte prodotte dai grandi modelli linguistici. Soprattutto nel caso di Gemini, che da un po’ di tempo non può rispondere a domande relative alle elezioni statunitensi del 2024.

Iscriviti alla newsletter

Non inviamo spam! Leggi la nostra Informativa sulla privacy per avere maggiori informazioni.