[Flug] Salvare pagine html riutilizabili

Tommaso Visconti tommaso.visconti@gmail.com
Gio 17 Lug 2014 17:17:48 CEST


Io uso sempre Nokogiri http://nokogiri.org/
Non so se fa al caso tuo, richiede un po' di programmazione, ma i
risultati sono eccellenti

Il 17 luglio 2014 17:02, Marco Calamari <marcoc1@dada.it> ha scritto:
> Ciao
>
> Ho la necessita' di recuperare dei contenuti ormai disponibili solo sul
> sito web di una nota rivista telematica italiana.
>
> Le pagine sono ovviamente quali quelle di un sito moderno, dinamiche,
> farcite di pubblicita', frame, supercazzole ed altro, che se
> stampate/salvate vengono riprodotte dai browser come file multipagina,
> ed il cui HTML "as is" e' inutilizzabile.
>
> Vorrei recuperare il contenuto originale, il solo testo o meglio ancora
> l'HTML con il link dei riferimenti, in una maniera piu' automatizzabile
> possibile per poterlo poi riutilizzare.
>
> Qualcuno ha idee da suggerirmi?
>
> Da un browser particolare con settaggi/plugin particolari, salvandosi
> svariate centinaia di pagine a mano ma in un formato riutilizzabile,
> fino a qualche toolettino scriptabile che lo faccia addirittura
> automaticamente?
>
> Grazie a tutti.  Marco
>
> _______________________________________________
> flug mailing list
> flug@lists.linux.it
> http://lists.linux.it/listinfo/flug


Maggiori informazioni sulla lista flug