Form-processing tool

Questa applicazione nasce all'interno di un progetto ("Extended recognition of digitized documents - REDD") finanziato da STI S.p.A. a cavallo tra il 2007 e il 2009 (partners: Signal Processing & Telecommunications Group - Numerical Image Processing, Dip. di Ingegneria Biomedica ed Elettronica, Università di Genova), con lo scopo di sviluppare il prototipo di un sistema di lettura e riconoscimento automatico della scrittura utente da immagini acquisite tramite scanner di documenti complessi come bollettini postali per il pagamento di tasse (un esempio è mostrato nella figura in basso), fatture e ricette mediche.

Obiettivo finale del progetto: predisporre un sistema che consentisse di localizzare i singoli campi di un dato documento, estrarne il testo inserito dall'utente e riconoscerlo. Il nostro compito in questo progetto è stato quello di sviluppare gli algoritmi per le prime quattro fasi di elaborazione:

  • stima e correzione dell'angolo di inclinazione del documento nell'immagine;
  • riconoscimento della struttura grafica (layout) del documento;
  • localizzazione dei singoli campi
  • rimozione delle parti prestampate e ricostruzione della scrittura utente.
 
Esempio di un bollettino postale per il pagamento di tasse considerato in questo progetto.
 

Gli algoritmi per le fasi successive (segmentazione della scrittura utente per l'individuazione dei singoli caratteri, riconoscimento dei caratteri e post-elaborazione contestuale) sono stati sviluppati dal nostro partner, il gruppo di ricerca del DIBE.

L'applicazione considerata in questo progetto è particolarmente complessa a causa della bassa qualità delle immagini dovuta al rumore introdotto in fase di acquisizione, la struttura grafica complessa e variabile di documenti come quelli considerati, e la frequente sovrapposizione della scrittura utente con le parti prestampate.



È disponibile un dimostratore online ed un video illustrativo della versione attuale del prototipo.