OpenAI, durante il suo evento Spring Update, ha finalmente svelato GPT-4o, ovvero l'aggiornamento più importante che abbia mai ricevuto il popolare chatbot. Questa versione, che sarà disponibile anche per gli utenti gratuiti, funzionerà in maniera simile a GPT-4, tuttavia con molta più velocità rispetto al "fratello maggiore".
Nuova modalità vocale e tempi di risposta più rapidi
Entrando nei particolari, GPT-4o beneficerà di una nuova tecnologia relativa alla modalità vocale, che gli utenti potranno sfruttare per parlare in maniera ottimale con ChatGPT tramite il proprio microfono. L'obiettivo di OpenAI, infatti, è quello di consentire agli utenti di parlare con il chatbot come se stessero conversando con una persona reale. Fino ad ora, tale modalità non garantiva un'esperienza sempre positiva. Ora, però, le cose potrebbero cambiare.
GPT-4o, infatti, grazie ad alcuni accorgimenti renderà possibile parlare molto più velocemente col chatbot. Per dimostrare il passo in avanti effettuato, l'azienda ha tenuto una conversazione di prova.
In questo contesto, il chatbot ha risposta al presentatore in maniera quasi instantanea. A riguardo, l'azienda ha evidenziato: "Con GPT-4o, abbiamo addestrato un singolo nuovo modello end-to-end su testo, visione e audio, il che significa che tutti gli input e le uscite vengono elaborati dalla stessa rete neurale". Inoltre, sempre durante la presentazione, GPT-4o è riuscito anche a fornire consigli al presentatore su come respirare in maniera più efficiente (prendendo dei campioni audio della sua voce).
Scendendo maggiormente nei dettagli, la nuova versione "Può rispondere agli ingressi audio in soli 232 millisecondi, con una media di 320 millisecondi, che è simile al tempo di risposta umano in una conversazione. Corrisponde alle prestazioni di GPT-4 Turbo sul testo in inglese e codice, con un miglioramento significativo sul testo in lingue non inglesi, pur essendo anche molto più veloce e il 50% più economico nell'API".
GPT-4o come "insegnante" e narratore di storie
In un'altra demo, GPT-4o ha raccontato una storia della buonanotte tramite il prompt"robot e amore".
Durante la narrazione, è stato chiesto al chatbot di regolare la propria voce a seconda dell'emozione. GPT-4o, quindi, ha dimostrato di poter essere protagonista sia di una performance drammatica che di una caratterizzata da toni freddi. Tra l'altro, il chatbot è riuscito anche ad intonare delle note sul finale della storia.
Infine, il chatbot è stato capace di aiutare i presentatori a risolvere un'equazione, assumendo quasi le "fattezze" di un insegnante. A questo proposito, è riuscito anche a rispondere ad una delle domande più avanzate dagli studenti: "A cosa ci servirà mai un'equazione nella vita reale?". GPT-4o ha replicato spiegando che questa operazione matematica può tornare utile in tante attività quotidiane.
Disponibilità
Questa nuova versione di ChatGPT sarà disponibile anche gratuitamente, tuttavia gli utenti premium avranno a disposizione maggiori opzioni e performance. Difatti, OpenAI ha chiarito: "Stiamo rendendo GPT-4o disponibile nel livello gratuito e per gli utenti Plus con limiti di messaggi fino a 5 volte superiori. Lanceremo una nuova versione della modalità vocale con GPT-4o in alfa all'interno di ChatGPT Plus nelle prossime settimane".
La stessa società, infine, ha dichiarato che "Gli sviluppatori possono ora accedere a GPT-4o nell'API come modello di testo e visione. GPT-4o è 2 volte più veloce, la metà del prezzo, e ha limiti di velocità 5 volte più alti rispetto a GPT-4 Turbo. Abbiamo in programma di lanciare il supporto per le nuove funzionalità audio e video di GPT-4o ad un piccolo gruppo di partner fidati nell'API nelle prossime settimane".