[Tech] Html2pdf : 2a puntata...

Lun 23 Apr 2001 13:03:01 CEST

On Mon, 23 Apr 2001, Mannucci Claudio wrote:

> Dopo aver provato (grazie ai suggerimenti di Claudio Cicali) HTMLDOC, mi si 
> pone un problema nella conversione di alcuni (...1100...) files HTML. :(
> Devo eliminare una porzione di codice html che è racchiusa tra 2 commenti.
> esempio:
> 
> <!--- inizio codice --->
> --------
> --------
> ---------
> <!--  fine codice -->
> 
> Credo che potrei usare SED oppure AWK, ma non avendoli MAI usati, mi trovo
> in difficoltà
> anche solo a leggermi la pagina MAN...(cosa che ho già fatto...)
> Potete darmi un consiglio?

un vero perlista darebbe una soluzione del tipo 

perl -p -i.old -0 -e 's/<!-- inizio.*?fine codice -->//sg' file1 file2...

che fa la cosa seguente: 

1) il -p "avvolge" il <programma> passato con -e nel loop
while (<>) {
	<programma>
} continue {
	print;
}
2) il -i esegue l'operazione inline, salvando il vecchio file
con l'estensione .old

3) il -0 fa si che tutto il file venga slurpato in una sola botta
(cosi' che appare come una sola stringa) 

(vedi perldoc perlrun)

da usarsi magari con:

find . -name '*.html' | perl -p -i.old -0 -e 's/<!-- inizio.*?fine codice
-->//sg'

Come inconveniente di questa suprema eleganza c'e' che i file originali
vengono rinominati con *.old, altrimenti tocca fare un programma 
piu' lungo...

-- 
Franco Bagnoli
Dipartimento di Matematica Applicata "G. Sansone"
Universita' di Firenze, Via S. Marta, 3 I-50139 Firenze, Italy
tel. +39 0554796422, fax: +39 055471787
e-mail: bagnoli@dma.unifi.it