L'app Gemini sta implementando una nuova interessante funzionalità che permette di generare riassunti audio in formato podcast dai documenti caricati. Questa funzione, denominata "Audio Overviews", è ora disponibile per gli utenti Android e iOS, dopo essere stata inizialmente lanciata sul web.
La novità, annunciata all'inizio di questa settimana, consente agli utenti sia gratuiti che abbonati al piano Advanced di trasformare documenti e presentazioni in conversazioni audio tra due host virtuali. Al momento, la funzione è disponibile solo in inglese, ma Google ha promesso l'arrivo di supporto per altre lingue nel prossimo futuro.
COME FUNZIONA
Per accedere a questa funzione sul dispositivo mobile, basta caricare un documento o una presentazione nell'app Gemini. A questo punto, apparirà un nuovo suggerimento "Generate Audio Overview" accanto all'opzione "Talk Live about this" (che, secondo quanto riportato, non è ancora completamente disponibile su Android).
È anche possibile generare un podcast audio dai report di approfondimento accedendo al menu a tre puntini. Dopo aver richiesto la generazione, l'elaborazione richiede alcuni minuti, al termine dei quali l'utente riceverà una notifica.
Un aspetto curioso di questa implementazione è l'assenza di un player audio integrato nell'app Gemini. Quando si tocca "Gemini Audio Overview", il file audio (in formato .m4a) si apre direttamente in una scheda del browser predefinito del dispositivo. Questa scelta appare insolita considerando che la versione web di Gemini (gemini.google.com) dispone invece di un player integrato per la riproduzione degli Audio Overviews.
Questi podcast possono durare diversi minuti e hanno lo scopo di "riassumere il materiale, stabilire connessioni tra diversi argomenti, creare un dialogo dinamico e offrire prospettive uniche".
È importante notare che quando gli Audio Overviews sono generati da file, la conversazione si basa esclusivamente sul contenuto del documento fornito e non sulle conoscenze generali dell'intelligenza artificiale, a differenza di quanto avviene con i podcast derivati dalla funzione Deep Research.