idee per il sito
Gabriele Mambrini
gm@badpenguin.org
Sat, 4 Aug 2001 19:36:01 -0400
> Ieri ho dato un'occhiata ai vari script per attingere a dmoz, c'è ne uno in
> php ma sembra un po' datato, ne ho trovato un'altro in php che funziona ma
> non sono riuscito a trovare il modo di scaricarlo, appena so qualcosa vi
> faccio sapere.
Magari... io ho trovato phpOpen ma non è esattamente uno script
spettacolare e cmq è poco riciclabile.
Quello che vorrei fare è distinguere nella tabella dei link quelli
autoprodotti da quelli importati da dmoz... periodicamente, come
accade per il garbage collector delle sessioni, vengono cancellati
questi link e reimportati da dmoz.
Per importare da dmoz ci sono due vie:
- parsare l'html e dedurne i contenuti
- usare rdf
La prima è la soluzione usata da phpOpen, la seconda è più pulita
ma mi sembra che dmoz esporta in un file unico tutti i contenuti
e quindi sarebbe una soluzione praticabile solo se si può mettere
un job sul server e non fidandosi del ``link collector''.
Se dmoz esportasse un rdf per ogni dir sarebbe la svolta.
ciao a tutti,
Gabriele