[Tech] OMR

Franco Bagnoli franco.bagnoli@unifi.it
Ven 20 Set 2002 08:30:36 CEST


On Wed, 18 Sep 2002, Valerio Montagnani wrote:

> On Wed, 18 Sep 2002 15:34:41 +0200 (CEST)
> Franco Bagnoli <franco.bagnoli@unifi.it> wrote:
> 
> [...] Non so di cosa si preciso cosa intendi per "tipo totocalcio",

di solito i moduli a lettura ottica (che tradizionalmente passano di 
fronte ad una schiera di fotosensori) hanno due marker neri alle estremità 
della riga per da re il consenso di acquisizione.

> comunque, se hai bisogno di fare del clustering, puoi usare le catene di
> markov nascoste (HMM). 

conosco poco le HMM, se ricordo bene si tratta di un automa stocastico 
Markoviano. Se tu avessi voglia di farci sopra un seminario ti 
invito qui all'Università. So che si usano per il clustering, ma forse non 
sono lo strumento più adatto per fare OMR, che è un  compito molto più 
semplice dell'OCR o del riconoscimento immagini.

il problema da come lo vedo io è il seguente: 

per semplicità consideriamo  una forma monodimensionale, la form è del 
tipo 

M:    111111     xxx     xxx     xxx    11111

dove "1" indica i marker e x il campo della risposta

dopo la scansione su un sample con tutti i campi marcati si può avere un 
oggetto del tipo (riporto anche il marker) 

M:    111111     xxx     xxx     xxx    11111
S:     110111  1  11 1     111     11  1  11101 1

dove si vede come ci sia del rumore, un effetto di traslazione e uno di 
dilatazione (dovuto all'ottica dello scanner). Per prima cosa c'è da 
calcolare il valore più probabile della 
traslazione e della dilatazione, usando i marker, e quindi calcolare se 
c'è abbastanza sovrapposizione tra i campi "x" e gli "1" nel sample. 

Nel caso bidimensionale ovviamente si ha traslazione (2 componenti), 
rotazione + dilatazione (4 componenti), ovvero 6 parametri da fissare, a 
meno che non si assuma che la rotazione è ininfluente (dato che i marker e 
i campi sono in genere così "spessi" che difficilmente vanno "fuori linea"

Chiaramente questi conti si possono fare nello spazio reale o nello spazio 
di Fourier o, forse meglio, usando delle wavelet, ma forse anche delle HMM 
usando il template (la form) come guida per il passaggio di stato 
dell'automa. 

Però io non ho tanta voglia di sviluppare tutto questo problema da zero, 
preferirei partire da cose già fatte.

In ogni caso mi piacerebbe produrre un software OMR libero. Tenete 
presente che si potrebbe applicare a tanti casi di rilevazione statistica, 
per esempio inviando le form compilate via fax. 

 
ciao.
  

-- 
Franco Bagnoli (franchino) <franco.bagnoli@unifi.it> (bagnoli@dma.unifi.it)
virtual location: Dipartimento di Energetica "S. Stecco"
real location: Dip. Matematica Applicata "G. Sansone", Universita' Firenze,
Via S. Marta, 3 I-50139 Firenze, Italy. Tel. +39 0554796422, fax: +39 055471787
GPG Key fingerprint = 169D 9EA5 8FD3 7EDA E43A  9830 255F BCEC 0D63 3728





Maggiori informazioni sulla lista flug-tech