OpenAI sta addestrando GPT-4 con i video di YouTube

5 months ago 148

Negli scorsi giorni, il Wall Street Journal ha diffuso una notizia secondo cui le società che operano nell'ambito dell'intelligenza artificiale stavano incontrando delle difficoltà sul recupero di dati di formazione di alta qualità. A riguardo, a fine 2021, OpenAI avrebbe esaurito le fonti affidabili di testo in lingua inglese presenti su internet. Per questo motivo, avrebbero sviluppato Whisper, uno strumento di riconoscimento vocale che consente la trascrizione dell'audio. 

Dunque, per superare queste difficoltà, secondo il New York Times, la società avrebbe trascritto oltre un milione di ore di video da YouTube per l'addestramento di GPT-4, anche se la piattaforma vieta sia il download che lo scraping dei filmati. Tra l'altro, la piattaforma avrebbe rilevato l'accesso da parte di OpenAI, tuttavia non vi sarebbe stato alcun intervento perché anche Google avrebbe trascritto i suoi video per addestrare i propri modelli di intelligenza artificiale. In tal senso, secondo un portavoce di Google, sono stati sottoscritti degli accordi con i creatori.

Dunque, è certo che per addestrare al meglio i modelli IA occorrono maggiori dati. Anche per questo motivo, il colosso di Mountain View ha modificato i termini dei servizi e della privacy per accedere ai dati pubblici innescati dagli utenti sulle varie app, come Maps e Documenti. A riguardo, sempre il portavoce della società, ha affermato che agli utenti viene chiesto un consenso esplicito. Anche Meta avrebbe incontrato delle difficoltà relative al recupero di dati. Tuttavia, per evitare denunce per violazione di copyright, l'azienda avrebbe preso in considerazione addirittura l'acquisto di un'importante casa editrice.

Per superare qualsiasi criticità, una delle soluzioni sarebbe quella riconducibile all'utilizzo dei dati sintetici, cioè quelli generati da altri modelli IA. Un dubbio circa questo percorso, però, è legato al rischio di incorrere in qualche errore. Insomma, la vicenda appare piuttosto complessa e sicuramente servirà diverso tempo prima di arrivare ad una svolta decisiva.

Read Entire Article