[ImoLUG] estrazione dati da pdf

fRANz andrea.francesconi@gmail.com
Mar 6 Set 2016 21:53:08 CEST


2016-09-06 14:29 GMT+02:00 Oscar -goo- Martignani <oscar.goo@gmail.com>:

> il problema è che le mail hanno una specie di formattazione standard non
> modificabile: nel subj e nel corpo non c'è scritto nulla tranne che dei dati
> generici, mentre tutto il "corpo" del messaggio è dentro al file .pdf
> allegato.

altra domanda: anche il pdf in allegato segue delle regole (vedi
"specie di formattazione standard non modificabile" sopracitata),
vero?
perchè se la risposta è no, parsare allegati 'a caso' con una semplice
regexp che intercetta una data equivale a tirare su _qualunque_ data
nel documento ergo quelle sì nel body, ma pure quelle
nell'intestazione o piè di pagina

> Per sapere se è un argomento urgente (data di consegna) bisogna aprire il
> pdf e verificare la casella apposta. siccome ci sono decine di mail ogni
> giorno, che occupano molto tempo alla persona che deve controllare, la mia
> idea era di fare qualcosa di automatizzato che scremasse almeno una parte
> delle cose più urgenti, lasciando il controllo manuale del resto un paio di
> volte alla settimana.

ho capito bene: l'automatismo che vai cercando sarebbe attivato 'in
contemporanea' su una mailbox parallelamente verificata da una
persona?
non farà casino? separarle in modo da dedicare una mailbox
all'automatismo? (sempre che la posta sia lo strumento giusto - vedi
sotto)

> però ad esempio se si riesce, come dice Kevin, ad estrarre il .pdf dalla
> mail, trasformarlo in plain text, applicare un filtro per identificare le
> date, e da queste fare un confronto con la data di controllo, sarebbe già un
> grande passo avanti per me.

sai che alla fine è la parte più semplice?
googola per fetchmail + procmail + save attachment e troverai un sacco
di esempi pronti ma rimane in me il dubbio di prima: è il modo più
furbo/safe?
se il 'ricevere pdf per posta' non fosse un vincolo, anche un
banalissimo form via web sarebbe sufficiente allo scopo - con
l'opportunità di sapere _esattamente_ quali sono i campi chiave e
gestire a posteriori una notifica puntuale in base alle tue necessità

-f


Maggiori informazioni sulla lista ImoLUG