[gl-como] Gentoo wiki giù

Nicola Viganò ben.vighy@gmail.com
Ven 24 Ott 2008 21:12:37 CEST


Elena of Valhalla ha scritto:
> tecnicamente qualcosa si potrebbe recuperare dalla cache di google, ma 
> sarebbe un puttanaio da reinserire
ok scriptino l'ho fatto sto pomeriggio.... l'ho messo ad andare,... e ho 
guardato ora:

#! /bin/bash

echo "recupero le pagine raggiungibili da $1"

ALL_LINKS=`grep "<a href=\"/" "$1"`

for x in $ALL_LINKS; do
  if [ ${x:0:7} = href=\"/ ]
  then
    x=${x:7}
    if [  ${x:0:9} != index.php ]
    then
      x=${x%\"}
      axel -a -o "$x" 
"http://74.125.39.104/search?q=cache:gentoo-wiki.com/${x}&hl=it&gl=it&strip=1"
    fi
  fi
done



i problemi però sono due: il primo è che esistono "voci" che sono 
denominate come se fossero in sottodirectory di altre voci... (tipo 
MPlayer e MPlayer/Usage e non avevo considerato questo fatto...) così' 
tutti quelli come MPlayer/Usage non è siuscito a salvarmeli su disco... 
a questo si può porre facilmente rimedio...

ma il secondo problema mi blocca del tutto: x velocizzare il tutto ho 
messo 3 terminali con lo stesso script e ognuno scaricava i link che 
trovava in Hardware, HOWTO, e TIPS... il rpboema è che google ha 
iniziato a bannarmi come se sul mio pc fosse un qualcosa che tenta di 
exploitare il sito della cache....

purtroppo ho scaricato solo una 70ina di voci.. quando quelle che si 
trovavano sulla wiki sono più di 1500...

se qualcun altro può provare... mi dice se sono stato io il pirla che ha 
mandato 3 script contemporaneamente oppure google mi avrebbe bannato 
anche con uno solo??

grazie Ciao! :)


Maggiori informazioni sulla lista gl-como