Ecco perché fareste meglio a usare ChatGPT in inglese

7 months ago 114

Ecco perché fareste meglio a usare ChatGPT in inglese

L'inglese è la lingua principale per il commercio, per la scienza e, ora, anche per l'intelligenza artificiale (sapete come usare ChatGPT o altri modelli IA?).

Non che ci fossero dubbi, e forse l'avrete notato anche voi: conversare con ChatGPT in italiano o in inglese non è la stessa cosa, ma ora diversi studi certificano questa sensazione. Ecco perché è un problema.

ChatGPT è molto meglio in inglese

Su Internet ci sono diversi meme che mostrano come gli americani vedono il resto del mondo. I più efficaci mostrano l'Europa come il luogo dove si beve vino e si mangiano spaghetti, il Sudamerica il posto del caffé e della cocaina, il medio oriente come petrolio e guerre, e l'Asia come un agglomerato di fabbriche per produrre scarpe o telefoni.

Il problema della lingua

Luoghi comuni, ma un aspetto è innegabile: l'inglese è la lingua regina per numerosi settori, come il commercio, la scienza o l'economia. Si pensava che l'intelligenza potesse in qualche modo appianare le differenze, e venire incontro a chi non parlava l'inglese, ma evidentemente questo non è successo.

A rivelarlo, diversi articoli scientifici, che mostrano come ChatGPT e soci non solo funzionino meglio a tradurre altre lingue in inglese che a effettuare il processo inverso (soprattutto per lingue non latine), ma come rispondano meglio in inglese, e soprattutto creino meno informazioni false (le cosiddette allucinazioni).

Un caso evidente, evidenziato in questo articolo, mostra come ChatGPT abbia dichiarato come una frase in inglese non fosse traducibile in vietnamita.

Si rischiano di aumentare le diseguaglianze

Il problema non riguarda solo il resto del mondo rispetto agli Stati Uniti, ma anche gli Stati Uniti Stessi. Se avete provato a leggere i testi di Gloria Anzaldúa, saprete come negli Stati Uniti la lingua sia un problema estremamente importante.

Il 44% dei californiani parla una lingua diversa dall'inglese, e il Congresso degli Stati Uniti ha chiesto a Sam Altman di OpenAI cosa stia facendo la sua azienda per colmare il divario linguistico.

Altman ha affermato di sperare di collaborare con governi e altre organizzazioni per acquisire set di dati che rafforzerebbero le competenze linguistiche di ChatGPT e ne amplierebbero i vantaggi a "un gruppo quanto più ampio possibile".

Perché le IA parlano inglese e perché è un problema

Perché le IA parlano inglese

OpenAI non ha nascosto il fatto che i suoi sistemi siano parziali. Il motivo è semplice. La maggior parte dei dati di allenamento derivano e, come dichiarato da OpenAI stessa, gli sforzi dell'azienda per mettere a punto e studiare le prestazioni del modello si sono concentrati principalmente sull'inglese "con un punto di vista incentrato sugli Stati Uniti".

Addirittura, come ha scritto un membro dell'assistenza a una richiesta su un forum dell'azienda, "Qualsiasi buon risultato in spagnolo è un bonus".

Perché è un problema

Il problema non riguarda solo la diseguaglianza. Il supporto alle lingue non è stato spiegato chiaramente agli utenti, e l'utilizzo di una metafora potrebbe risultare diverso a seconda della lingua.

Per esempio, un modello multilingue potrebbe associare la parola colomba in tutte le lingue con la pace, anche se la parola basca ("uso") può essere un insulto.

Oppure si potrebbero non ottenere risultati corretti nelle ricerche. Per esempio utilizzando Bing per cercare i termini regionali colloquiali utilizzati per indicare le scarpe da tennis, in inglese una ricercatrice non ha avuto problemi (sneakers per Stati Uniti, joggers per Australia, trainers per il Regno Unito). Quando è passata allo spagnolo, le risposte non sono state corrette. E lo stesso per altre ricerche.

Questo implica che può essere anche difficile fidarsi delle traduzioni, o di risposte in altre lingue. E questo può essere un problema anche nella programmazione e generazione di codice.

Le soluzioni? Poco convincenti

Le soluzioni non sono molto convincenti. I dirigenti di Microsoft, OpenAI e Google che lavorano sui chatbot hanno affermato che gli utenti possono ottenere risposte corrette aggiungendo istruzioni più dettagliate alle loro domande.

Alcuni hanno semplicemente scoperto come sia meglio usare direttamente l'inglese. E questo vale anche per il cinese, una delle lingue più parlate al mondo.

Gli altri modelli IA

Come abbiamo anticipato, il problema non riguarda solo ChatGPT.

PaLM 2 di Google

Google ha annunciato che il suo modello PaLM 2, rilasciato questo mese, contiene dati di addestramento non inglese per oltre 100 lingue. Il modello riconosce gli idiomi in tedesco e swahili, le battute in giapponese e corregge la grammatica in indonesiano, afferma Google, e riconosce le variazioni regionali meglio dei modelli precedenti.

Ma per gli utenti Gemini non è altrettanto versatile. Il modello basato su PaLM 2 funziona solo in inglese americano, giapponese e coreano. L'assistente alla scrittura per Gmail supporta solo l'inglese.

Le soluzioni non sono semplici

E probabilmente non basterà neanche aumentare il volume di dati in altre lingue, perché i contenuti in inglese sono molti di più e continuano ad aumentare.

La risposta? Creare dati finti da dare in pasto all'IA, ma non sembra ancora una soluzione. Oppure controlli più rigorosi, come ha cercato di fare Google con PaLM.

Ma la domanda è: agli sviluppatori di modelli IA interessa cambiare la situazione? Forse no, per cui è bene tenerlo presente quando useremo ChatGPT o Gemini.

Read Entire Article