R: [Gulli] Re: mediaWiki e mirror

Alessandro Guarguaglini ilguargua@tiscali.it
Gio 4 Maggio 2006 22:21:48 CEST


Alle 06:12, giovedì 4 maggio 2006, f_paolini@alice.it ha scritto:
> >Come si automatizza tale operazione di "rimozione" di sezioni
> >all'interno di file di testo?
>
> per la  serie anche questo è linux ti dico una sola parola perl
>
> buon divertimento :-)

Certo che siete dei cattivoni... :-))
Vi e' forse ignota l'atavica pigrizia del Roatta ??

Vabbe' Carlo, io ti consiglio awk , sintatticamente un pochino piu' chiaro di 
perl e sed, ma in casi semplici altrettanto efficace :

#! /usr/bin/awk -f

# A me sembra che il taglio venga meglio qui, poi vedi te...
  { if ( index($0, "<div id=\"column-one\">") > 0 )
   {
    while (getline )
     {
      if (index($0,"</body>") > 0)
        {
         print "</body> </html>"
         break
        }
      }
    } else print $0
   }


Copia il tutto in un file, es. myscript, rendilo eseguibile (chmod +x 
myscript) , dagli in pasto le pagine e copia il risultato :

cat wikipage.html | myscript > wikipage-stripped.html

Si puo' fare di meglio, ma questo intanto funziona.

Ciao, a presto.

--

Scarica i miei tutorial!

LIRC :            
   http://www.classicistranieri.com/lirc.pdf
Introduzione alla compressione video :
   http://www.classicistranieri.com/compr_video.pdf
Strategie per la codifica video :
   http://www.classicistranieri.com/strategie.pdf


Maggiori informazioni sulla lista Gulli