[gl-como] Gentoo wiki giù
Nicola Viganò
ben.vighy@gmail.com
Ven 24 Ott 2008 21:12:37 CEST
Elena of Valhalla ha scritto:
> tecnicamente qualcosa si potrebbe recuperare dalla cache di google, ma
> sarebbe un puttanaio da reinserire
ok scriptino l'ho fatto sto pomeriggio.... l'ho messo ad andare,... e ho
guardato ora:
#! /bin/bash
echo "recupero le pagine raggiungibili da $1"
ALL_LINKS=`grep "<a href=\"/" "$1"`
for x in $ALL_LINKS; do
if [ ${x:0:7} = href=\"/ ]
then
x=${x:7}
if [ ${x:0:9} != index.php ]
then
x=${x%\"}
axel -a -o "$x"
"http://74.125.39.104/search?q=cache:gentoo-wiki.com/${x}&hl=it&gl=it&strip=1"
fi
fi
done
i problemi però sono due: il primo è che esistono "voci" che sono
denominate come se fossero in sottodirectory di altre voci... (tipo
MPlayer e MPlayer/Usage e non avevo considerato questo fatto...) così'
tutti quelli come MPlayer/Usage non è siuscito a salvarmeli su disco...
a questo si può porre facilmente rimedio...
ma il secondo problema mi blocca del tutto: x velocizzare il tutto ho
messo 3 terminali con lo stesso script e ognuno scaricava i link che
trovava in Hardware, HOWTO, e TIPS... il rpboema è che google ha
iniziato a bannarmi come se sul mio pc fosse un qualcosa che tenta di
exploitare il sito della cache....
purtroppo ho scaricato solo una 70ina di voci.. quando quelle che si
trovavano sulla wiki sono più di 1500...
se qualcun altro può provare... mi dice se sono stato io il pirla che ha
mandato 3 script contemporaneamente oppure google mi avrebbe bannato
anche con uno solo??
grazie Ciao! :)
Maggiori informazioni sulla lista
gl-como