HTRflow, una soluzione open-source per il riconoscimento della scrittura prodotta dall’Archivio Nazionale Svedese

2 days ago 32

L’archivio nazionale svedese, che si chiama Riksarkivet nella propria lingua, ha rilasciato HTRflow, una soluzione open-source che consente di riconoscere la scrittura manuale all’interno delle immagini.

Il nome del software è composto da HTR che sta per Handwritten Text Recognition e da quel flow che tanto richiama le tecnologie AI che ormai sono parte del quotidiano (qualcuno ha mai sentito parlare di MLflow?) e che anche in questo caso ricoprono la parte più interessante del prodotto.

Infatti, HTRflow include Swedish Lion Libre, un modello AI allenato sulla scrittura a mano (in svedese) di documenti del periodo storico 1600-1900. Non a caso, leggendo il blog di presentazione del progetto ci si imbatte in una delle immagini che sono usate per allenare il modello:

The tool used above is a spaces demo using

Ed anche in un esempio pratico di come possa essere elaborata un’immagine, utilizzando il modello Riksarkivet/trocr-base-handwritten-hist-swe-2 con Python:

from transformers import TrOCRProcessor, VisionEncoderDecoderModel from PIL import Image import requests # Load the processor and model processor = TrOCRProcessor.from_pretrained('Riksarkivet/trocr-base-handwritten-hist-swe-2') model = VisionEncoderDecoderModel.from_pretrained('Riksarkivet/trocr-base-handwritten-hist-swe-2') # Load an image containing handwritten text, e.g local image or an image URL image_url = 'https://example.com/your_handwritten_image.jpg' # Replace with your image URL image = Image.open(requests.get(image_url, stream=True).raw).convert('RGB') # Preprocess the image pixel_values = processor(images=image, return_tensors="pt").pixel_values # Generate transcription (you can adjust parameters like max_length and num_beams) generated_ids = model.generate(pixel_values, max_length=512) # Decode the generated IDs to text transcription = processor.batch_decode(generated_ids, skip_special_tokens=True)[0] print("Transcription:", transcription)

La cosa interessante è che HTRflow, ovviamente, non si limita allo svedese, ma proprio seguendo il principio delle pipeline AI offre tutto il necessario per elaborare, e addestrare, modelli in qualsiasi lingua.

Quello che abbiamo raccontato è quindi l’ennesimo esempio del potere dell’open-source.

Gli archivi nazionali svedesi hanno, come tutti i paesi, un’ampia collezione di documenti che comprendono una vasta gamma di dati provenienti da varie fonti. Una parte significativa di questi è digitalizzata, ma in forma manoscritta. Si tratta quindi di sole immagini che difficilmente potrebbero promuovere nuove ricerche e conoscenze, a meno di non venire trascritti in testo ricercabile.

Ecco quindi HTRflow, che grazie all’archivio nazionale svedese è distribuito in modalità usabile e modificabile dal mondo.

Il blog post di cui abbiamo parlato in apertura ad onor del vero risale allo scorso ottobre, ma il motivo per cui ci siamo accorti di questo bel progetto è, manco a dirlo, il fatto che sia stato raccontato dall’Open Source Observatory, che non manca mai di segnalare progetti interessanti come questo.

Da sempre appassionato del mondo open-source e di Linux nel 2009 ho fondato il portale Mia Mamma Usa Linux! per condividere articoli, notizie ed in generale tutto quello che riguarda il mondo del pinguino, con particolare attenzione alle tematiche di interoperabilità, HA e cloud.
E, sì, mia mamma usa Linux dal 2009.

Read Entire Article