Gemini 1.0 è stata presentata come l'IA più potente al mondo. Una settimana dopo Google annuncia il successore

1 year ago 408

Dalle parti di Mountain View sta succedendo qualcosa di strano: neanche una settimana dopo aver annunciato Gemini 1.0, il nuovo avanzatissimo modello IA declinato nelle versioni Gemini Nano, Pro e Ultra, è già la volta del successore, Gemini 1.5 (se volete sapere cosa sia Gemini, date un'occhiata al nostro approfondimento, mentre qui potete scoprire come provarlo in anteprima, in italiano).

Stando a Google, il nuovo modello "offre prestazioni notevolmente migliorate", soprattutto per quanto riguarda la "comprensione dei contesti lunghi", tanto che Gemini 1.5 Pro è già ai livelli di Gemini 1.0 Ultra, ma necessita di meno potere computazionale.

Quindi in teoria gli utenti gratuiti potrebbero a breve accedere a funzionalità comparabili a quelle degli utenti a pagamento (il modello Pro è disponibile nel chatbot Gemini gratuito, mentre il modello Ultra è accessibile usando il chatbot Gemini Advanced a pagamento, grazie Google per confondere sempre).

Nel suo annuncio, che non prende in considerazione la versione Ultra del modello (probabilmente ancora in fase di sviluppo), Google afferma che Gemini 1.5 rappresenta una nuova generazione di LLM (Large Language Models) che "offre una svolta nella comprensione del contesto lungo" e che se al momento nella versione Gemini 1.5 Pro elabora una finestra di contesto di 128.000 token, alcuni sviluppatori sono in grado di provare già fino a 1 milione di token, "raggiungendo la finestra di contesto più lunga di qualsiasi modello di fondazione su larga scala".

I token, rappresentano i frammenti di una parola: più ce ne sono, più grande è il contesto che si può dare al chatbot nel prompt per farlo "ragionare" su un argomento. Una finestra di contesto più grande consente di elaborare documenti più lunghi e di avere conversazioni più lunghe.

Per confronto, Gemini 1.0 gestisce 32.000 token, mentre GPT-4 Turbo di Open AI ha una finestra di contesto di 128.000 token, equivalenti a circa 300 pagine di testo in un prompt.

Google ha pubblicato un articolo a supporto delle potenzialità del modello in cui spiega che Gemini 1.5 utilizza una nuova architettura mixture-of-experts (MoE), il che significa che il sistema attiva selettivamente diversi "esperti" o sottomodelli specializzati all'interno di una rete neurale più ampia per attività specifiche basate sui dati di input.

Nel rapporto, la GrandeG spiega che Gemini 1.5 offre un miglioramento sostanziale rispetto a 1.0, dicendo che supera 1.0 Pro del 28,9% in "Math, Science & Reasoning" e 1.0 Ultra del 5,2%, nelle stesse materie.

Allo stesso modo, Google confronta il nuovo modello con GPT-4 Turbo, rivelando prestazioni mediamente migliori.

La GrandeG dichiara che il nuovo modello è in grado di eseguire "un ragionamento complesso su grandi quantità di informazioni" e fornisce un esempio di analisi di una trascrizione di 402 pagine della missione dell'Apollo 11 (quella che è andata sulla Luna).

Certo il risultato è impressionante, ma bisogna sempre tenere presente che questi modelli quando hanno a che fare con grandi contesti tendono a fare errori, quindi bisogna vedere come si comporterà sul campo.

Ancora più stupefacente, Google ha fatto vedere al modello Gemini 1.5 Pro un film muto di Buster Keaton di 44 minuti, ed è poi stato in grado di analizzare con precisione vari punti ed eventi della trama, e persino ragionare su piccoli dettagli, mentre un altro esempio riguarda la capacità di ragionare su un progetto da più di 100.000 linee di codice e dare spiegazioni su come funziona.

Insomma, Gemini 1.5 sembra un notevole passo avanti, ma quello che stupisce è la tempistica. Che senso ha annunciarlo a una settimana dal lancio di Gemini 1.0?

È la dimostrazione della velocità di sviluppo nel campo dell'IA, o solo scarsa comunicazione tra i gruppi di ricerca e marketing? Oppure Google sa qualcosa che noi non sappiamo, e si sta preparando per assorbire il colpo di un nuovo modello concorrente come GPT-5?

Al momento non si può sapere, ma quello che si sa è che Gemini 1.5 Pro non è ancora disponibile sull'app Gemini, ed è in preview per sviluppatori e clienti aziendali tramite AI Studio e Vertex AI.

Read Entire Article