5 novità a tema IA che cambieranno il modo di usare tanti servizi Google

10 months ago 119

5 novità a tema IA che cambieranno il modo di usare tanti servizi Google

Questa settimana, durante l'evento Cloud Next, Google ha annunciato una serie di novità a tema intelligenza artificiale che saranno disponibili per vari suoi servizi nelle settimane e mesi a venire.

Ecco quindi le 5 novità principali, come funzionano, e quando e per chi arriveranno.

Gemini 1.5 Pro guadagna l'udito

Google's Gemini 1.5 Pro è adesso in grado di processare anche i file audio. Ciò gli consente di estrarre informazioni direttamente dall'audio stesso, rendendolo più capace di prima in una varietà di applicazioni.

Immaginate ad esempio di dover sbobinare una lezione universitaria, oppure di volere il riassunto di un lungo TED talk. Le possibilità sono moltissime.

Da notare che questo nuovo modello supera il precedente Gemini Ultra, sia in velocità che nella comprensione di istruzioni complesse, senza bisogno di ulteriori interventi dell'utente.

Arrivano le GIF!

Google ha annunciato che Imagen 2.0 ha una nuova funzionalità che gli consente di trasformare testi in immagini animate, come le GIF, con durata di 4 secondi a 24 fps e risoluzione di 360 x 640 pixel.

Non esattamente un video in HD insomma.

In compenso sarà possibile generare anche una serie di movimenti di camera, facendo mantenere all'immagine una certa consistenza durante tutta la scena.

Questa opzione, che ovviamente prevede ulteriori miglioramenti futuri, è per ora riservata al settore business. Tuttavia, gli strumenti avanzati di modifica foto di Imagen saranno disponibili al pubblico e accessibili tramite Google Gemini e altri servizi Google.

Note e traduzioni in Google Meet

Google ha introdotto nuove funzionalità basate sull'intelligenza artificiale per le app di Google Workspace, mirate a migliorare il lavoro e la collaborazione, soprattutto per gli utenti aziendali.

Queste includono la trascrizione automatica delle conversazioni e la traduzione in tempo reale in 69 lingue, entrambe in Google Meet, promettendo di ridurre le barriere linguistiche.

Se tutto funzionasse fantasticamente come nell'animazione qui sopra saremmo davanti a una piccola rivoluzione, ma l'esperienza ci insegna a non prendere per oro colato questi annunci, e a riservare un giudizio solo dopo averli provati.

Questi strumenti sono attualmente in fase di test, con l'aggiunta di miglioramenti AI anche per Google Chat. Saranno in futuro disponibili attraverso un add-on a pagamento (10$ a utente al mese)

Google Vids

Google Vids è una nuova app di Workspace per creare e modificare video, con funzionalità di assistenza nella scrittura e produzione.

L'idea non è tanto di competere con Sora di OpenAI, quanto di "raccontare storie" in ambienti lavorativi, permette di collaborare e condividere facilmente.

Gli utenti possono generare storyboard, scegliere stili video e sfruttare un'ampia libreria di media. Vids include anche un Recording Studio per il voiceover, promettendo di rendere chiunque un ottimo narratore sul lavoro.

Vids sarà inizialmente disponibile in Workspace Labs da giugno 2024.

Fogli, Documenti e Gmail

Google sta introducendo una nuova funzione di tabelle in Fogli per organizzare i dati con un design moderno.

Google Documenti riceverà invece delle nuove schede che aiuteranno a trovare informazioni correlate e immagini di copertina a pieno schermo.

Queste funzioni saranno disponibili per tutti gli utenti nelle prossime settimane

Gmail mobile permetterà infine di scrivere email con comandi vocali, mentre Gemini in Gmail introdurrà una funzione per rifinire bozze con un clic.

Questa novità sarà disponibili nelle prossime settimane per gli utenti Workspace, Gemini Enterprise, Gemini Business e abbonati Google One AI Premium.

Read Entire Article