Un team di ricercatori dell'Università Tsinghua, in collaborazione con Zhipu AI, ha sviluppato un innovativo modello di linguaggio di grandi dimensioni (LLM) chiamato LongWriter, capace di generare testi fino a 10.000 parole. Questa scoperta potrebbe rivoluzionare il modo in cui l'intelligenza artificiale interagisce con la scrittura di lungo formato.
Finora, la maggior parte degli LLM era limitata a una produzione di circa 2.000 parole, principalmente a causa dell'addestramento su documenti brevi. Il team cinese ha superato questa barriera modificando l'architettura dell'LLM e addestrandolo su un nuovo dataset chiamato "LongWriter-6k", contenente 6.000 documenti con lunghezze variabili da 2.000 a 32.000 parole.
La chiave del successo di LongWriter risiede in una pipeline denominata AgentWrite, che scompone il materiale di addestramento in sotto-compiti durante l'elaborazione. Questo approccio ha permesso al modello di gestire e generare testi significativamente più lunghi rispetto ai suoi predecessori.
I ricercatori hanno testato LongWriter facendogli produrre una guida turistica di 10.000 parole sulla Cina, dimostrando la coerenza e l'usabilità dei testi generati in vari contesti. Il codice del modello è stato reso open-source su GitHub, permettendo ad altri ricercatori di costruire su questa base.
Tuttavia, questa innovazione solleva anche questioni etiche. La capacità di generare interi articoli di ricerca, libri o sceneggiature apre nuovi scenari nel dibattito sull'uso responsabile dell'intelligenza artificiale nella creazione di contenuti.
Lo studio, dettagliato in un articolo pre-print su arXiv, segna un passo significativo verso LLM più versatili e capaci di gestire compiti di scrittura complessi e di lunga durata. Resta da vedere come questa tecnologia verrà integrata e regolamentata nei vari settori che potrebbero beneficiarne, dalla ricerca accademica all'industria dell'intrattenimento.
Sempre per restare in argomento, lo sapevate che Primate Labs, l'azienda dietro il noto benchmark Geekbench, ha annunciato il lancio di Geekbench AI? Si tratta di un nuovo strumento di benchmarking progettato specificamente per valutare le prestazioni dei dispositivi nelle attività di machine learning. Geekbench AI, precedentemente noto come Geekbench ML durante la fase di anteprima, è ora disponibile per il pubblico su una vasta gamma di piattaforme, tra cui iOS, Android, Windows, macOS e Linux.