R: [Gulli] Re: mediaWiki e mirror
Alessandro Guarguaglini
ilguargua@tiscali.it
Gio 4 Maggio 2006 22:21:48 CEST
Alle 06:12, giovedì 4 maggio 2006, f_paolini@alice.it ha scritto:
> >Come si automatizza tale operazione di "rimozione" di sezioni
> >all'interno di file di testo?
>
> per la serie anche questo è linux ti dico una sola parola perl
>
> buon divertimento :-)
Certo che siete dei cattivoni... :-))
Vi e' forse ignota l'atavica pigrizia del Roatta ??
Vabbe' Carlo, io ti consiglio awk , sintatticamente un pochino piu' chiaro di
perl e sed, ma in casi semplici altrettanto efficace :
#! /usr/bin/awk -f
# A me sembra che il taglio venga meglio qui, poi vedi te...
{ if ( index($0, "<div id=\"column-one\">") > 0 )
{
while (getline )
{
if (index($0,"</body>") > 0)
{
print "</body> </html>"
break
}
}
} else print $0
}
Copia il tutto in un file, es. myscript, rendilo eseguibile (chmod +x
myscript) , dagli in pasto le pagine e copia il risultato :
cat wikipage.html | myscript > wikipage-stripped.html
Si puo' fare di meglio, ma questo intanto funziona.
Ciao, a presto.
--
Scarica i miei tutorial!
LIRC :
http://www.classicistranieri.com/lirc.pdf
Introduzione alla compressione video :
http://www.classicistranieri.com/compr_video.pdf
Strategie per la codifica video :
http://www.classicistranieri.com/strategie.pdf
Maggiori informazioni sulla lista
Gulli