Serata all'insegna dell'intelligenza artificiale quella vissuta durate l'ultimo Google I/O del 14 maggio, infatti, l'azienda non ha deluso le aspettative di coloro che attendevano novità corpose in questo segmento. Si è parlato di AI dall'inizio alla fine e chi ci segue con costanza avrà sicuramente notato che vi abbiamo fornito una copertura completa degli annunci principali.
Per facilitare il tutto a chi volesse conoscere tutte le novità in una volta sola, abbiamo pensato di realizzare un articolo cumulativo. Ecco cosa vi siete persi, punto per punto!
GOOGLE SEARCH: RISULTATI PERSONALIZZATI CON L'AI
Google Search sta per fare un importante salto di qualità grazie all'AI. Durante la conferenza Google I/O per gli sviluppatori, l'azienda ha svelato diverse funzionalità che sfruttano l'intelligenza artificiale per fornire risposte complete direttamente ai quesiti degli utenti, aiutandoli anche nella pianificazione di attività ed eventi.
La novità principale è Panoramica IA, che mostrerà risposte generate dall'AI in cima ai risultati di ricerca per la maggior parte delle query. Per alcune ricerche, come ristoranti, ricette, film ecc., Google mostrerà pagine di risultati completamente organizzate dall'AI per facilitare l'esplorazione e trovare ispirazione. Google punta anche a diventare un assistente per pianificare pasti e viaggi, grazie all'AI che suggerirà piani alimentari e idee di viaggio personalizzabili. Infine, è in sviluppo una funzione che permetterà di usare video come query di ricerca, aprendo nuove possibilità.
CHIEDI A FOTO, LA NUOVA FUNZIONE AI DI GOOGLE FOTO
Google ha annunciato "Chiedi a Foto", una nuova funzionalità di Google Foto che sfrutta le capacità dell'IA di Gemini per aiutare gli utenti a trovare e rivivere i propri ricordi fotografici in modo più intuitivo. Gemini utilizzerà le sue capacità di comprensione del linguaggio, ricerca visiva e analisi delle immagini per interpretare le richieste e fornire le foto più pertinenti come risposta. Gli utenti potranno anche fornire feedback per migliorare l'IA.
Google ha sottolineato l'attenzione alla privacy, garantendo che le domande non vengono memorizzate, l'elaborazione avviene nel cloud senza coinvolgere persone e i dati personali non verranno usati per addestrare altri prodotti AI al di fuori di Google Foto.
GOOGLE WORKSPACE: NUOVE INTERAZIONI CON L'AI
Google ha annunciato nuove funzionalità per sfruttare al meglio l'intelligenza artificiale Gemini all'interno di Google Workspace, con l'obiettivo di aumentare la produttività sia nella vita privata che lavorativa. In primo luogo, Gemini arriva nel pannello laterale di Gmail, Documenti, Drive, Presentazioni e Fogli utilizzerà ora Gemini 1.5 Pro, con una finestra di contesto più ampia e ragionamento avanzato per rispondere a un'ampia gamma di domande e fornire risposte più approfondite.
Novità sono in arrivo anche per l'app mobile di Gmail, tra cui la funzione "Riassumi email" che fornirà un riepilogo delle conversazioni direttamente nell'app. Le "Risposte Intelligenti Contestuali" offriranno suggerimenti di risposta personalizzati in base alle email, mentre "Gmail Q&A" permetterà di porre domande specifiche a Gemini, come "trovare l'offerta dell'impresa edile" nelle email ricevute.
Inoltre, la funzione "Aiutami a scrivere" in Documenti e Gmail supporterà presto altre lingue come spagnolo e portoghese, dopo l'inglese, facilitando la collaborazione internazionale.
Durante il keynote di I/O, Google ha mostrato le potenzialità del suo sistema di intelligenza artificiale Gemini, tra cui la possibilità di creare un vero e proprio collaboratore virtuale all'interno di Workspace.
Questo assistente intelligente avrebbe un proprio account Workspace e potrebbe essere incaricato di svolgere diverse mansioni per alleggerire il tuo carico di lavoro, tra cui il monitoraggio e tracciamento di progetti, l'organizzazione delle informazioni, l'analisi dei dati e individuazione di trend e molto altro. Il progetto sembra ancora in fase embrionale, pertanto ne sapremo di più in futuro.
GEMINI PER ANDROID, SEMPRE PIU' INTEGRATO
Google sta integrando sempre più l'intelligenza artificiale nel sistema operativo Android, reinventando il modo di interagire con gli smartphone. Ecco le novità annunciate:
- Cerchia e Cerca ora può aiutare gli studenti con i compiti per materie come matematica e fisica direttamente sullo schermo, grazie all'integrazione di LearnLM. Questa funzione verrà ampliata per risolvere problemi più complessi.
- Gemini su Android migliorerà la comprensione del contesto visualizzato sullo schermo e dell'app in uso. Gli utenti potranno spostare l'overlay di Gemini sopra le app per trascinare immagini generate, chiedere informazioni su video o documenti PDF.
- Gemini Nano, il primo modello AI on-device integrato in un sistema operativo mobile, avrà funzionalità multimodali complete sui Pixel entro fine anno, comprendendo non solo testo ma anche luoghi, suoni e linguaggio parlato.
- Talkback sfrutterà Gemini Nano per fornire descrizioni più dettagliate delle immagini agli utenti non vedenti o ipovedenti.
- Rilevamento frodi: si sta testando una funzione che utilizza Gemini Nano per rilevare potenziali frodi durante le chiamate e avvisare l'utente in tempo reale.
GEMINI FLASH, LIVE E MIGLIORAMENTI A 1.5 PRO
Google ha presentato Gemini 1.5 Flash, un nuovo modello di linguaggio della famiglia Gemini progettato per essere più veloce ed efficiente rispetto a Gemini 1.5 Pro, rendendolo più accessibile agli sviluppatori. Nonostante le dimensioni ridotte, Gemini 1.5 Flash mantiene le stesse capacità multimodali e un'ampia finestra di contesto di 1 milione di token del modello Pro, permettendogli di eccellere in attività come riassunti, chat, didascalie e analisi di dati.
Gemini 1.5 Flash è pensato come strumento per gli sviluppatori che vogliono creare prodotti e servizi AI, non per l'utilizzo diretto dagli utenti finali.
Inoltre, Google ha annunciato aggiornamenti a Gemini 1.5 Pro, migliorando le sue capacità di scrittura di codice, ragionamento e analisi di audio e immagini. Entro fine anno, la finestra di contesto di Pro verrà raddoppiata a 2 milioni di token. Sia Gemini 1.5 Flash che l'aggiornato 1.5 Pro sono ora disponibili in anteprima su Google AI Studio e Vertex AI. Google ha anche rilasciato una nuova versione del suo modello open source Gemma, chiamata Gemma 2.
Google ha introdotto anche Gemini Live, una nuova funzionalità per smartphone che permette conversazioni naturali con l'intelligenza artificiale.
Si tratta di un passo avanti rispetto ai classici assistenti vocali: Gemini Live consente di parlare liberamente, interrompere le risposte dell'IA e avere conversazioni fluide su diversi argomenti. L'intelligenza artificiale è in grado di adattarsi al contesto e fornire risposte pertinenti. Gemini Live sarà disponibile prossimamente per gli abbonati a Gemini Advanced.
Google sta per introdurre una nuova funzione per Gemini AI chiamata "Memoria". Questa funzione permetterà al chatbot di ricordare informazioni raccolte da conversazioni passate e utilizzarle per personalizzare gli scambi futuri. In pratica, Gemini memorizzerà dettagli come interessi, preferenze e informazioni personali per offrire risposte più pertinenti e contestuali. Ad esempio, se parli del tuo cane, Gemini potrebbe farne riferimento in conversazioni future.
Inoltre, la "Memoria" permetterà a Gemini di imparare di più su di te nel tempo, migliorando la sua capacità di interagire in modo naturale. I vantaggi della memoria includono conversazioni più fluide, risposte più pertinenti e un'esperienza di apprendimento continuo.
VEO, IMAGEN 3 E MUSIC AI SANDBOX: GENERAZIONI MULTIMEDIALI SENZA LIMITI
Google punta sull'intelligenza artificiale per la creazione di contenuti multimediali presentando tre novità: Veo, Imagen 3 e Music AI Sandbox.
- Veo genera video in alta qualità (1080p) da semplici descrizioni testuali, simula la fisica del mondo reale e integra tecniche cinematografiche. Si pone come diretto competitor di Sora di OpenAI.
- Imagen 3 è l'ultima evoluzione del modello di Google per la generazione di immagini da testo. Promette immagini fotorealistiche e punta a superare Dall-E 3 di OpenAI e Stable Diffusion nella gestione dei prompt complessi.
- Music AI Sandbox è una suite di strumenti che sfrutta l'intelligenza artificiale per facilitare la creazione di musica.
Queste novità aprono scenari interessanti per il futuro della creazione di contenuti multimediali, ma resta da vedere se l'IA riuscirà a generare arte con un vero "animo".
Ma Google punta sulla trasparenza per i contenuti generati dall'intelligenza artificiale. I suoi strumenti di generazione video, Veo, e di testo, Gemini, utilizzeranno entrambi il sistema di watermarking proprietario di Google, SynthID. SynthID inserirà watermark digitali impercettibili nei contenuti creati dall'IA, in modo che possano essere identificati come tali dagli strumenti di rilevamento automatico.
PROJECT ASTRA
Google ha presentato Project Astra, una nuova app che integra l'intelligenza artificiale di Gemini con la fotocamera dello smartphone. Project Astra permette di:
- Chiedere informazioni a Gemini su oggetti inquadrati dalla fotocamera (es. stringhe di codice, oggetti sul tavolo).
- Dare compiti creativi o pratici a Gemini (es. creare allitterazioni, trovare oggetti smarriti).
- Funzionare con occhiali smart per interagire con l'intelligenza artificiale a mani libere e vedere le informazioni direttamente sulle lenti.
Project Astra rappresenta un passo avanti nell'intelligenza artificiale mobile e apre nuove possibilità per l'interazione con la tecnologia. L'azienda ha anche mostrato un sample basato sull'utilizzo di questa tecnologia.