[Tech] Pattern Recognition e/o OCR
Szymon Stefanek
pragma@firenze.linux.it
Gio 11 Maggio 2006 19:40:53 CEST
On Thursday 11 May 2006 13:08, Marco Marcantelli (kaifa) wrote:
> Salve Gente,
>
> vorrei riconoscere da un immagine scannerizzata (PDF/TIF) una certa
> forma o scritta fissa, ma in posizione differente.
>
> Mi spiego meglio : trovare una forma tipo un cerchio o qualcos'altro con
> dentro un testo variabile, oppure direttamente un testo variabile che
> inizia sempre per (ad esemipo) *** e finisce per ***.
> Lo scopo è quello di leggere il testo variabile che sta nel cerchio o tra
> gli *** anche se sta in posizioni differenti........
Se c'è un pattern ben riconoscibile dentro il testo non hai bisogno di
"cercare" dentro l'immagine. Passi il tutto all'ocr e cerchi dentro il testo
a suon di "strcmp" (occhio alla fuzziness: gli ocr sbagliano :).
Trovare la forma diventa in generale più complicato. Specialmente se questa è
variabile, distorta o corrotta da rumore...
Ci sono diversi approcci alla ricerca di forme: dipende da cosa e in cosa devi
cercare esattamente. Per trovare un timbro ben riconoscibile e sempre uguale
(non ruotato!) in una pagina relativamente vuota puoi usare la "minima
differenza" rispetto ad un pattern noto. Scorri, cioè, l'immagine calcolando
la differenza in ogni punto rispetto ad una immagine di riferimento del
timbro e assumi che esso si trovi nella posizione in cui ottieni la
differenza minima (se questa è sotto una certa soglia).
Un'altro approccio è quello di calcolare le componenti connesse
presenti all'interno dell'immagine e studiarne la forma. Se cerchi delle
circonferenze, ad esempio, puoi verificare che la forma sia chiusa, abbia il
"centro di massa" contenuto all'interno del perimetro e che la "varianza" del
raggio esterno calcolata rispetto a questo centro sia vicina a zero...
Questo sistema è,in generale, più complicato.
> Avete la minima idea come fare ? esistono delle librerie o programmi da
> riga comando affidabili in merito ?
C'è ocrad. Non è il massimo, ma se il tuo testo è ben leggibile puoi
accontentarti. Ci sono altri due o tre ocr liberi in giro ma quando li provai
ocrad risultò fra tutti il migliore.
Sei comunque nel campo del riconoscimento delle immagini. I problemi reali che
vi si presentano sono in generale difficili.
--
Szymon Stefanek
------------------------------------------------------------------------------
-
- Powered by Chernobyl Nuclear Power Plant.
-
------------------------------------------------------------------------------
-------------- parte successiva --------------
Un allegato non testuale è stato rimosso....
Nome: non disponibile
Tipo: application/pgp-signature
Dimensione: 189 bytes
Descrizione: non disponibile
URL: <http://lists.linux.it/pipermail/flug-tech/attachments/20060511/4e16f348/attachment.pgp>
Maggiori informazioni sulla lista
flug-tech