Google presenta Gemini 1.5 Flash, un nuovo LLM della famiglia Gemini di intelligenza artificiale progettato per essere più veloce ed efficiente, con l'obiettivo di renderla più accessibile agli sviluppatori. Nato per rispondere alle esigenze degli sviluppatori che necessitano di un modello AI più leggero e meno costoso rispetto a Gemini 1.5 Pro, Gemini 1.5 Flash sfrutta un processo chiamato "distillazione" per trasferire le conoscenze essenziali di Gemini 1.5 Pro al nuovo modello più piccolo.
"Gemini 1.5 Flash eccelle in attività come riassunti, conversazioni in chat, didascalie per immagini e video, estrazione di dati da documenti e tabelle lunghi e molto altro", spiega Demis Hassabis, CEO di Google DeepMind.
Nonostante la sua natura "light", Gemini 1.5 Flash mantiene la stessa potenza del modello Pro, ereditando le sue capacità multimodali e un'ampia finestra di contesto che gli permette di analizzare fino a un milione di token contemporaneamente (equivalenti a circa 1.500 pagine di un documento o 30.000 righe di codice).
Gemini 1.5 Flash, così come l'intera famiglia Gemini, non è pensato per gli utenti finali, bensì come strumento per gli sviluppatori che desiderano creare i propri prodotti e servizi di intelligenza artificiale utilizzando la tecnologia Google.
Oltre al lancio di Gemini 1.5 Flash, Google annuncia anche aggiornamenti per Gemini 1.5 Pro, migliorando le sue capacità di scrittura del codice, ragionamento e analisi di audio e immagini. Entro la fine dell'anno, la finestra di contesto del modello verrà raddoppiata a due milioni di token, permettendogli di elaborare due ore di video, 22 ore di audio, oltre 60.000 righe di codice o più di 1,4 milioni di parole contemporaneamente.
Sia Gemini 1.5 Flash che Pro sono ora disponibili in anteprima pubblica su Google AI Studio e Vertex AI. Google ha inoltre annunciato una nuova versione del suo modello open source Gemma, chiamata Gemma 2.
Con l'introduzione di Gemini 1.5 Flash e gli aggiornamenti a Gemini 1.5 Pro, Google dimostra il suo impegno nel rendere l'intelligenza artificiale più accessibile e potente per gli sviluppatori, aprendo nuove possibilità per la creazione di innovative applicazioni e servizi.