
L’archivio nazionale svedese, che si chiama Riksarkivet nella propria lingua, ha rilasciato HTRflow, una soluzione open-source che consente di riconoscere la scrittura manuale all’interno delle immagini.
Il nome del software è composto da HTR che sta per Handwritten Text Recognition e da quel flow che tanto richiama le tecnologie AI che ormai sono parte del quotidiano (qualcuno ha mai sentito parlare di MLflow?) e che anche in questo caso ricoprono la parte più interessante del prodotto.
Infatti, HTRflow include Swedish Lion Libre, un modello AI allenato sulla scrittura a mano (in svedese) di documenti del periodo storico 1600-1900. Non a caso, leggendo il blog di presentazione del progetto ci si imbatte in una delle immagini che sono usate per allenare il modello:

Ed anche in un esempio pratico di come possa essere elaborata un’immagine, utilizzando il modello Riksarkivet/trocr-base-handwritten-hist-swe-2 con Python:
La cosa interessante è che HTRflow, ovviamente, non si limita allo svedese, ma proprio seguendo il principio delle pipeline AI offre tutto il necessario per elaborare, e addestrare, modelli in qualsiasi lingua.
Quello che abbiamo raccontato è quindi l’ennesimo esempio del potere dell’open-source.
Gli archivi nazionali svedesi hanno, come tutti i paesi, un’ampia collezione di documenti che comprendono una vasta gamma di dati provenienti da varie fonti. Una parte significativa di questi è digitalizzata, ma in forma manoscritta. Si tratta quindi di sole immagini che difficilmente potrebbero promuovere nuove ricerche e conoscenze, a meno di non venire trascritti in testo ricercabile.
Ecco quindi HTRflow, che grazie all’archivio nazionale svedese è distribuito in modalità usabile e modificabile dal mondo.
Il blog post di cui abbiamo parlato in apertura ad onor del vero risale allo scorso ottobre, ma il motivo per cui ci siamo accorti di questo bel progetto è, manco a dirlo, il fatto che sia stato raccontato dall’Open Source Observatory, che non manca mai di segnalare progetti interessanti come questo.
Da sempre appassionato del mondo open-source e di Linux nel 2009 ho fondato il portale Mia Mamma Usa Linux! per condividere articoli, notizie ed in generale tutto quello che riguarda il mondo del pinguino, con particolare attenzione alle tematiche di interoperabilità, HA e cloud.
E, sì, mia mamma usa Linux dal 2009.