idee per il sito

Gabriele Mambrini gm@badpenguin.org
Sat, 4 Aug 2001 19:36:01 -0400


> Ieri ho dato un'occhiata ai vari script per attingere a dmoz, c'è ne uno in 
> php ma sembra un po' datato, ne ho trovato un'altro in php che funziona ma 
> non sono riuscito a trovare il modo di scaricarlo, appena so qualcosa vi 
> faccio sapere.

Magari... io ho trovato phpOpen ma non è esattamente uno script 
spettacolare e cmq è poco riciclabile.

Quello che vorrei fare è distinguere nella tabella dei link quelli
autoprodotti da quelli importati da dmoz... periodicamente, come
accade per il garbage collector delle sessioni, vengono cancellati 
questi link e reimportati da dmoz.

Per importare da dmoz ci sono due vie:
- parsare l'html e dedurne i contenuti
- usare rdf

La prima è la soluzione usata da phpOpen, la seconda è più pulita
ma mi sembra che dmoz esporta in un file unico tutti i contenuti
e quindi sarebbe una soluzione praticabile solo se si può mettere
un job sul server e non fidandosi del ``link collector''.
Se dmoz esportasse un rdf per ogni dir sarebbe la svolta.

ciao a tutti,
Gabriele