Stack Exchange, la rete che include Stack Overflow, ha sospeso la pubblicazione dei dump, violando la licenza Creative Commons

3 months ago 97

Con una mossa che potremmo definire contraddittoria, Stack Exchange, la rete di siti in modalità Questions & Answers che comprende tra gli altri anche Stack Overflow, ha sospeso la pubblicazione dei contributi degli utenti su The Internet Archive, dove fino a poco tempo fa ogni tre mesi veniva depositato il dump degli archivi.

L’Internet Archive, per quanti non lo sapessero, è una biblioteca digitale che preserva e rende accessibili contenuti online, famoso per la sua time machine, dove è possibile ricostruire la storia e l’evoluzione dei siti internet più famosi, viene utilizzato anche per altri scopi.

Stack Exchange infatti proprio lì pubblicava ogni tre mesi i contributi degli utenti per garantire la trasparenza, l’accessibilità, e la preservazione a lungo termine dei dati, in linea con la licenza Creative Commons (CC BY-SA) che richiede la condivisione e attribuzione dei contenuti. Questo permetteva a chiunque di accedere, studiare e utilizzare questi dati liberamente.

L’annuncio fatto da Stack Exchange, raccontato in questo articolo di Dev Class, cambia le carte in tavola, andando a sospendere la pubblicazione così come era prevista e riportando invece gli articoli all’interno del proprio portale, dove continuano ad essere liberamente accessibili, ma previo login.

Il che significa nella sostanza che i contenuti non sono più così liberi come l’annuncio vorrebbe fare credere, ed ovviamente più di un utente ha espresso il proprio disappunto, indicando come questo tipo di approccio in realtà contravvenga alla licenza Creative Commons che consente al pubblico di “remixare, trasformare e sviluppare il materiale per qualsiasi scopo, anche commerciale“, previa attribuzione.

Vien da sé come questa decisione non sia per nulla inattesa, o quantomeno sorprendente. Sono mesi infatti, anzi anni, precisamente, da quando cioè ChatGPT è una realtà (novembre 2022) che siti come Stack Overflow le stanno tentando tutte per sopravvivere, tra le recenti proteste degli utenti che dopo l’annuncio dell’accordo con OpenAI avevano sabotato i commenti, il precedente sciopero dei moderatori, ed in generale i tentativi di rimanere a galla con prodotti come OverflowAI, una cosa è molto chiara a tutti: Stack Overflow non se la passa bene economicamente e vuole limitare il più possibile che i propri dati vengano utilizzati per alimentare LLM che non siano quelli a loro prediletti.

Il cambiamento in corso è inevitabile e sistemi che ormai sono considerati obsoleti e retrogradi come Stack Overflow sono inevitabilmente destinati all’oblio, a meno di non trovare meccanismi e nuove modalità di promozione.

Combattere le crisi però non giustifica il violare licenze come la CC BY-SA che parlano estremamente chiaro a proposito di come i contenuti debbano essere condivisi.

Qualche utente, come racconta l’articolo, afferma che la pubblicazione indipendente di dump sarà l’inevitabile conseguenza di questo approccio, ed anche se Philippe Beaudette, VP of community, dice di esserne al corrente, si dice altresì speranzoso che questo non sarà necessario.

Convinto lui…

Da sempre appassionato del mondo open-source e di Linux nel 2009 ho fondato il portale Mia Mamma Usa Linux! per condividere articoli, notizie ed in generale tutto quello che riguarda il mondo del pinguino, con particolare attenzione alle tematiche di interoperabilità, HA e cloud.
E, sì, mia mamma usa Linux dal 2009.

Read Entire Article