In occasione del Google I/O è stata annunciata una nuova funzionalità per Google Foto denominata "Ask Photos". La funzione sfrutta l'intelligenza artificiale di Gemini per consentire agli utenti di cercare immagini specifiche utilizzando comandi vocali e testuali. Gemini di fatto è il vero protagonista di questa edizione 2024 del Google I/O, e la conferenza per sviluppatori è iniziata con un qualcosa di più utile agli utenti che ai developer, comunque più che sufficiente per dimostrare la direzione intrapresa da Big. G con la sua IA.
La potenza della ricerca (vocale o testuale)
Google Foto integra già un motore di ricerca che trova con discreta facilità quello che stiamo cercando. Al momento però si possono fare ricerche molto generiche, come banalmente "hamburger", "gatto" o richiedere foto di persone che abbiamo registrato nell'app taggando i volti.
Grazie a Gemini e ad Ask to Photos, gli utenti potranno descrivere ciò che stanno cercando e ottenere risultati maggiormente pertinenti in pochi secondi.
Si potranno usare descrizioni dettagliate come "foto di Natale 2022 con la famiglia" o "foto di Francesca che impara a nuotare" per ottenere non solo risultati ben più specifici che in passato, ma veri e propri caroselli di immagini sensate e ordinate, quasi sulla falsa riga di mini-album fotografici.
Durante l'evento Google ha fatto anche l'esempio della targa dell'auto. Se avete comprato un'automobile è probabile che gli abbiate scattato una foto, e se non vi ricordate la targa (per fatica o perché sapete dove cercarla), su Google Foto basta scrivere "Auto" o "targa" per trovare tutti i risultati inerenti. Ecco, con Ask to Photos non dovrete più sfogliare tutte le immagini di auto per trovare quella giusta: sarà Gemini a trovare la targa dell'auto proponendovi direttamente il suo numero.
E i video? Ask Photos funzionerà anche con quelli a quanto pare, ma Google al momento non ha mostrato la funzionalità in azione.
Il Contributo di Gemini
Gemini, l'intelligenza artificiale utilizzata per "Ask Photos", sfrutta algoritmi di machine learning per comprendere le richieste vocali e testuali degli utenti, migliorando la capacità di riconoscimento e ricerca anche all'interno di app come Google Foto. Al Google I/O tra l'altro lo stesso Sundar Pichai ha annunciato novità per quanto riguarda Gemini 1.5 e il numero di token che può digerire. Senza scendere troppo in dettaglio, Gemini digerisce sempre più dati tenendo di conto di sempre più informazioni (fino a 2 milioni di token, secondo l'ultimo aggiornamento) dando risposte sempre più precise e consistenti. E Google Foto è solo uno dei tanti strumenti di Google che potrà sfruttare la sempre crescente potenza di Gemini.
Una curiosità su Google Foto
Non immaginereste mai quante foto e video vengono caricati su Google Foto ogni giorno. Un milione? 100 milioni? No, 6 miliardi. Sei miliardi di foto e video ogni giorno, ovvero 2.190 miliardi l'anno.
Disponibilità
Google ha annunciato che la funzione "Ask Photos" sarà disponibile nei prossimi mesi per tutti gli utenti di Google Foto, anche se come di consueto si partirà prima dagli Stati Uniti.
L'azienda prevede di integrare ulteriormente Gemini in Google Foto in futuro.