[Tech] OMR
Franco Bagnoli
franco.bagnoli@unifi.it
Ven 20 Set 2002 08:30:36 CEST
On Wed, 18 Sep 2002, Valerio Montagnani wrote:
> On Wed, 18 Sep 2002 15:34:41 +0200 (CEST)
> Franco Bagnoli <franco.bagnoli@unifi.it> wrote:
>
> [...] Non so di cosa si preciso cosa intendi per "tipo totocalcio",
di solito i moduli a lettura ottica (che tradizionalmente passano di
fronte ad una schiera di fotosensori) hanno due marker neri alle estremità
della riga per da re il consenso di acquisizione.
> comunque, se hai bisogno di fare del clustering, puoi usare le catene di
> markov nascoste (HMM).
conosco poco le HMM, se ricordo bene si tratta di un automa stocastico
Markoviano. Se tu avessi voglia di farci sopra un seminario ti
invito qui all'Università. So che si usano per il clustering, ma forse non
sono lo strumento più adatto per fare OMR, che è un compito molto più
semplice dell'OCR o del riconoscimento immagini.
il problema da come lo vedo io è il seguente:
per semplicità consideriamo una forma monodimensionale, la form è del
tipo
M: 111111 xxx xxx xxx 11111
dove "1" indica i marker e x il campo della risposta
dopo la scansione su un sample con tutti i campi marcati si può avere un
oggetto del tipo (riporto anche il marker)
M: 111111 xxx xxx xxx 11111
S: 110111 1 11 1 111 11 1 11101 1
dove si vede come ci sia del rumore, un effetto di traslazione e uno di
dilatazione (dovuto all'ottica dello scanner). Per prima cosa c'è da
calcolare il valore più probabile della
traslazione e della dilatazione, usando i marker, e quindi calcolare se
c'è abbastanza sovrapposizione tra i campi "x" e gli "1" nel sample.
Nel caso bidimensionale ovviamente si ha traslazione (2 componenti),
rotazione + dilatazione (4 componenti), ovvero 6 parametri da fissare, a
meno che non si assuma che la rotazione è ininfluente (dato che i marker e
i campi sono in genere così "spessi" che difficilmente vanno "fuori linea"
Chiaramente questi conti si possono fare nello spazio reale o nello spazio
di Fourier o, forse meglio, usando delle wavelet, ma forse anche delle HMM
usando il template (la form) come guida per il passaggio di stato
dell'automa.
Però io non ho tanta voglia di sviluppare tutto questo problema da zero,
preferirei partire da cose già fatte.
In ogni caso mi piacerebbe produrre un software OMR libero. Tenete
presente che si potrebbe applicare a tanti casi di rilevazione statistica,
per esempio inviando le form compilate via fax.
ciao.
--
Franco Bagnoli (franchino) <franco.bagnoli@unifi.it> (bagnoli@dma.unifi.it)
virtual location: Dipartimento di Energetica "S. Stecco"
real location: Dip. Matematica Applicata "G. Sansone", Universita' Firenze,
Via S. Marta, 3 I-50139 Firenze, Italy. Tel. +39 0554796422, fax: +39 055471787
GPG Key fingerprint = 169D 9EA5 8FD3 7EDA E43A 9830 255F BCEC 0D63 3728
Maggiori informazioni sulla lista
flug-tech