<p dir="ltr">Quella è la lingua, serve per capire le lettere strane. Tipo, in italiano ci sono molti accenti, in spagnolo ci sono le lettere tipo la n col tilde sopra, i punti interrogativi e esclamativi rovesciati ecc. In francese c'è la c col gambino sotto, e così via... per cui imposti la lingua e lui così vede tra quali caratteri effettuare il riconoscimento.</p>
<p dir="ltr">Il vocabolario però non è implementato, come si vede dai test. Guarda per esempio le parole con una lettera sbagliata, se il vocabolario fosse implementato non ci sarebbero quei casi di errore.</p>
<div class="gmail_quote">Il 23/giu/2015 13:41, "Matteo Martinelli" <<a href="mailto:matomoto32@gmail.com">matomoto32@gmail.com</a>> ha scritto:<br type="attribution"><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><p dir="ltr">Ho sempre utilizzato il parametro -l<br>
Non è quelli a definire il dizionario? </p>
<div class="gmail_quote">Il 23/giu/2015 13:39, "Gabriele Tenucci" <<a href="mailto:gabriele.tenucci@gmail.com" target="_blank">gabriele.tenucci@gmail.com</a>> ha scritto:<br type="attribution"><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><p dir="ltr">Ah, i test erano senza vocabolario, implementando quello la precisione dovrebbe aumentare parecchio</p>
<div class="gmail_quote">Il 23/giu/2015 10:14, "Alek Mugnozzo" <<a href="mailto:mugnozzo@gmail.com" target="_blank">mugnozzo@gmail.com</a>> ha scritto:<br type="attribution"><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><div dir="ltr"><div>Sono contento che abbiate fatto tutti questi test.<br></div><div>Sono anche contento che i problemi principali siano la risoluzione e la rotazione, perché possiamo ovviarli usando fotocamere buone (tipo la mia e quella del Martinelli) e per le foto dritte basta calibrarle bene all'inizio.<br></div><div>Poi ne parliamo meglio e appena ho un secondo guardo i test che linkati da Matteo.<br></div></div><div class="gmail_extra"><br clear="all"><div><div><div dir="ltr"><div><div dir="ltr"><div><div dir="ltr"><div><div><div><div>--------------------------------------<br><img src="https://docs.google.com/uc?export=download&id=0B61H6-nVtxr-SVZBaUVTZmRQdms&revid=0B61H6-nVtxr-UzVFZEtrY21VcEppZW5Ka1ZsU1NnYmNmUmxnPQ" height="200" width="200"><br>Alek Mugnozzo<br>e-mail: <a href="mailto:info@mugnozzo.net" target="_blank">info@mugnozzo.net</a><br></div><div>pec: <a href="mailto:mugnozzo@pec.mugnozzo.net" target="_blank">mugnozzo@pec.mugnozzo.net</a><br></div><div>web: <a href="http://mugnozzo.net" target="_blank">http://mugnozzo.net</a><br></div>phone: <a href="tel:%2B39%20320%205325471" value="+393205325471" target="_blank">+39 320 5325471</a><br></div><div>twitter: @mugnozzo<br></div>facebook (Personal): <a href="https://www.facebook.com/mugnozzo" target="_blank">Alek Mugnozzo</a><br></div>facebook (Company): <a href="https://www.facebook.com/mugnozzo.net" target="_blank">Mugnozzo</a><br>skype: mugnozzo<br></div>linkedin: Alessio Mugnani<br><div><div><div>--------------------------------------<br><br><i>AVVERTENZE AI SENSI DEL D.Lgs. 196/2003 E DIRITTO DI OPPOSIZIONE. Le
informazioni contenute in questo messaggio di posta elettronica e/o
nel/i file/s allegato/i sono da considerarsi strettamente riservate. Il
loro utilizzo è consentito esclusivamente al destinatario del messaggio,
per le finalità indicate nel messaggio stesso. Qualora riceviate questo
messaggio senza esserne il destinatario, Vi preghiamo cortesemente di
darcene notizia via e-mail e di procedere alla distruzione del messaggio
stesso, cancellandolo dal Vostro sistema. Conservare il messaggio
stesso, divulgarlo anche in parte, distribuirlo ad altri soggetti,
copiarlo, od utilizzarlo per finalità diverse, costituisce comportamento
contrario ai principi dettati dal D.Lgs. 196/2003.</i><br></div></div></div></div></div></div></div></div></div></div>
<br><div class="gmail_quote">Il giorno 23 giugno 2015 00:39, Matteo Martinelli <span dir="ltr"><<a href="mailto:matomoto32@gmail.com" target="_blank">matomoto32@gmail.com</a>></span> ha scritto:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><div dir="ltr"><div>Aggiungo qualche dettaglio ora dato che la mail precedente l' ho inviata via cellulare<br></div><div>Dopo varie prove siamo arrivati a queste conclusioni:</div><div><br></div><div>1. Tesseract ha bisogno di foto il più risolute possibile, la pulizia dell' immagine è di minore importanza. </div><div>Come si vede dai test 2 e 3, le immagini sono perfette ma il riconoscimento è pessimo a differenza del test 5, foto più "sporca" ma con risoluzione molto più alta</div><div><br></div><div>2. Tesseract divide l' immagine in blocchi di testo che poi riconosce uno dopo l' altro, per questo motivo è necessario fare foto più dritte possibile.</div><div>L' immagine 4 è un esempio abbastanza lampante, testo semplice con font ben riconoscibile, è stata riconosciuta solo la parte destra.</div><div>Un risultato simile lo abbiamo ottenuto con il titolo del test 9</div><div><br></div><div>3. Una carta molto sporca può generare artefatti durante il riconoscimento (vedi test 8)</div><div><br></div><div>4. Non riesce a riconoscere i paragrafi che iniziano con lettere grandi, questo porta a sbagliare l' inizio di tutte le righe che vengono "invase" da queste letterone (vedete il test 11 per capire bene)</div><div><br></div><div>5. Le foto sfocate gli danno molta noia, vedere la seconda colonna del test 12</div><div><br></div><div>Il test 5 e 6 sono praticamente perfetti</div><div><br></div><div><br></div><div>Mi sono dimenticato qualcosa ?</div><div><div><div class="gmail_extra"><div class="gmail_quote">Il giorno 22 giugno 2015 23:19, Matteo Martinelli <span dir="ltr"><<a href="mailto:matomoto32@gmail.com" target="_blank">matomoto32@gmail.com</a>></span> ha scritto:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><p dir="ltr">Abbiamo fatto 12 test per valutare tesseract <br>
Ci sono anche 2 documenti in inglese <br>
Ecco un link con i risultati ottenuti <br>
<a href="https://goo.gl/nr5EUU" target="_blank">https://goo.gl/nr5EUU</a></p>
</blockquote></div><br></div></div></div></div>
<br><br>
--<br>
Mailing list info: <a href="http://lists.linux.it/listinfo/luccalug-soci" rel="noreferrer" target="_blank">http://lists.linux.it/listinfo/luccalug-soci</a><br>
<br></blockquote></div><br></div>
<br><br>
--<br>
Mailing list info: <a href="http://lists.linux.it/listinfo/luccalug-soci" rel="noreferrer" target="_blank">http://lists.linux.it/listinfo/luccalug-soci</a><br>
<br></blockquote></div>
<br><br>
--<br>
Mailing list info: <a href="http://lists.linux.it/listinfo/luccalug-soci" rel="noreferrer" target="_blank">http://lists.linux.it/listinfo/luccalug-soci</a><br>
<br></blockquote></div>
<br><br>
--<br>
Mailing list info: <a href="http://lists.linux.it/listinfo/luccalug-soci" rel="noreferrer" target="_blank">http://lists.linux.it/listinfo/luccalug-soci</a><br>
<br></blockquote></div>