[FoLUG][OT] Come funziona Google?

Marco Valli - Cosmo folug@lists.linux.it
Thu, 19 Dec 2002 15:08:45 +0100


-----BEGIN PGP SIGNED MESSAGE-----
Hash: SHA1

Dalla lista Rekombinant un'interessante discussione sul funzionamento 
del motore di ricerca Google e le sue analogie con i sistemi 
democratici.
saluti

===

Google si e' affermato verso al fine degli anni 90 come il piu' popolare 
search engine disponibile in rete. Il suo successo cosi' come le sue 
credenziali "democratiche" si basano su un sistema di computazione dei 
link associati alla pagina.

<< PageRank relies on the uniquely democratic nature of the web by using 
its vast link structure as an indicator of an individual page's value. 
In essence, Google interprets a link from page A to page B as a vote, 
by page A, for page B. But, Google looks at more than the sheer volume 
of votes, or links a page receives; it also analyzes the page that 
casts the vote. Votes cast by pages that are themselves "important" 
weigh more heavily and help to make other pages "important." >>

Il problema con questo approccio e' che i siti di maggiore peso, quelli 
che sono riferiti da un maggiore numero di link, sono ovviamente i siti 
dei maggiori operatori in rete. Il loro "voto" conta di piu' di quello 
dei siti piu' piccoli. Il risultato e' il virtuale oscuramento dei siti 
minori.

La pretesa "democraticita'" di google si rivela dunque essere 
esattamente l'opposto di cio' che dichiara: una funzione del cosidetto 
corporate takeover della rete. Il diavolo sta nei dettagli.
Per saperne di piu':
http://www.google-watch.org/pagerank.html

v

===

Ciao Vittorio, permettimi di muovere qualche appunto sulla tua 
conclusione a riguardo di Google

>Il problema con questo approccio e' che i siti di maggiore peso, quelli 
>che sono riferiti da un maggiore numero di link, sono ovviamente i 
>siti dei maggiori operatori in rete. Il loro "voto" conta di piu' di 
>quello dei siti piu' piccoli. Il risultato e' il virtuale oscuramento 
>dei siti minori.

Ovviamente ??? no non e' una cosa tanto ovvia, anzi!

Il sistema di Pageranking di Google, nasce per risolvere un problema: 
quello della rilevanza delle informazioni nelle pagine risultato di una 
ricerca. Il problema e' di proporzioni enormi, data l'inefficacia 
provata di metodi di autodeterminazione dei contenuti (es: i meta tags) 
regolarmente abusati dai nuovi barbari della rete: siti commerciali 
"rispettabili" oppure stile "sexy sluts" e privati che creano siti web 
senza il benche' minimo rispetto della Netiquette, e spesso neanche la 
sua conoscenza. Anche cercare di analizzare i contenuti e' impresa 
ardua per una macchina, allo stato attuale e' pressocche' impossibile 
farlo efficacemente, e comunque anche quando la tecnologia avanzasse da 
quel punto di vista , non essendoci effettiva comprensione dei 
significati da parte delle macchine, un siffatto sistema sarebbe 
vulnerabile all'astuzia umana piu' degli altri, cosa resta? il 
pageranking? esiste un sistema che prescinde dalla comprensione del 
contenuto/stile e che sia efficace a parte quelli basati sulla stessa 
idea di google?

Prima di Google i motori di ricerca indicizzavano semplicemente le 
pagine e poi facevano mercimonio dei primi posti in ogni ricerca, un 
mercimonio molto redditizio e molesto per l'utente, che aveva 
praticamente annullato i vantaggi di fare una ricerca. Questi gia' poco 
utili motori di ricerca,con la bolla dot.com, si trasformarono in 
portali, seguendo il bandwagon di chi pensava che ai lobotomizzati 
utenti che si voleva creare infarcendo la rete di lustrini e 
paillettes, servisse una baby-sitter,un "portale".

Il sistema di Google, quantomeno oggettivo e imparziale, in quanto 
basato su regole fissate e non sul mercimonio, semplicemente ha fissato 
un nuovo standard di qualita' e di rispetto per l'utente oltreche' di 
*stile*. Ha infatti una particolare qualita': FUNZIONA!

Mediamente facendo una ricerca, nei primi dieci link forniti si trovano 
almeno 7 o 8 totalmente in topic, e spesso anche quello che si cercava 
veramente,l'opzione " mi sento fortunato" che da solo il link piu' 
rilevante e' un segno di quanto i creatori confidino nell' efficacia 
del Pageranking, e a ragione.

Il fine di un motore di ricerca non e' quello di dare visibilita' ai 
siti,o alle persone ma ai *contenuti* (pessimo termine contenuti, eh)

I soggetti su cui opera un motore di ricerca non devono essere i siti, 
ma i *contenuti*, i "memi" se preferite , quando si fa una ricerca 
sulle megattere non e' importante che venga segnalato il sito di 
Peppiniello Grattugia tra gif animate e cazzate, dice due parole su 
quando ha fatto la gita in California e ha visto una megattera, ma 
piuttosto le pagine che danno reali informazioni e a cui , in un mondo 
ideale, molte piu' persone che scrivono sulle balene fanno riferimento 
piazzando un link, nei loro *contenuti* web. Siccome dovrebbero 
esistere piu' webmaster interessati a cio' che pubblicano, rispetto a 
quelli che sono amici personali di Peppino o che tacchinano sua sorella 
e vogliono farlo contento, l'efficacia del pageranking e' assicurata 
(date queste premesse, e la natura stessa dell'ipertesto).

E dovrebbero esistere anche molti piu' siti con contenuti originali 
rispetto a quelli che pedissequamente linkano "portali" amici 
altrimenti il problema sarebbe ben maggiore.

Lo stesso vale per i siti commerciali e i portali, che sicuramente sono 
una percentuale molto bassa, anche se ricevono molto traffico; quindi 
tralasciando gli scambi di favori e/o di soldi ad esempio attraverso 
prog di partnership che pero' non credo siano statistic. rilevanti :

- - Se contengono informazioni originali utili meritano di essere linkati 
nel *contesto* di info su un alro sito, e quindi di essere in cima alla 
lista.

- - Altrimenti, il link e' il risultato di una sudditanza psicologica e/o 
mancanza di ragionamento critico,da parte dei webmaster che li linkano, 
quindi un problema umano

>La pretesa "democraticita'" di google si rivela dunque essere 
>esattamente l'opposto di cio' che dichiara: una funzione del cosidetto 
>corporate takeover della rete.

Au contraire,hai dimostrato l'opposto: infatti i problemi del sistema di 
Google sono esattamente quelli delle varie forme di rappresentanza 
democratica, in particolare quelli legati al fattore umano e alla 
manipolazione delle menti. E cosi' anche per l'eventuale cura (se fosse 
necessaria): piu' ragione critica e un assunzione della coscienza di se 
tanto nel caso dei Netizen, come nei cittadini.

L'unica differenza e' che in rete, l' "uomo nuovo" e' il vecchio utente, 
e i nuovi utenti, purtroppo, spesso rappresentano l'uomo consumatore 
contemporaneo che adora lustrini, flashes e paillettes.

Lavo

===

No caro Lavo,

non sono d'accordo. Mi sembra sia piuttosto tu a perdere l'oggetto. C'e' 
una differenza fondamentale fra l'essere irrilevante (anche se i vari 
pippinielli mi stanno simpatici) e l'essere minoritario. E di questo 
ultimo io volgio discutere, non del primo. Forme di pesniero 
minoritarie non dovrebbero essere discriminate in ragione delle logiche 
interne al sistema. Come altrimenti formare dopo cio' che viene dopo ed 
al di la' dell'opinione pubblica ? Come si forma cio' che Alex chiamava 
in altro contesto "l'opinione diffusa" ? Anche .. Il concetto di 
oggettivita' cui ti rifai mi sembra povero. Cero 2+2=4 in Italia cosi' 
come nel resto di (questo) universo. Ma il "fatto" che certi siti 
abbiano un certo peso dipende per lo piu' da fattori "esterni", 
rapporti di potere esistenti nel "mondo reale" di fronte a cui google 
volentieri si inchina.

Insomma. Il funzionamente del sistema non e' oggettivo. Meglio questa 
oggettivita' non e' che un construtto artificiale la cui logica va 
investigata dal punto di vista del mondo "reale", cioe' dei rapporti 
sociali che essa oggettiva e riproduce.

ciao

v

===

Devo dire, caro Vittorio, che la tua risposta mi sembra dare ragione a 
Lavo: è vero che un procedimento come quello applicato da Google 
penalizza, nei risultati, i siti "minoritari", ma è altrettanto vero 
che la subordinazione delle minoranze alle maggioranze, il maggior peso 
dato a queste, è proprio l'aspetto strutturalmente tipico di ogni forma 
di democrazia che non si basi sul procedimento del consenso pieno 
(procedimento inapplicabile, ovviamente e per le più svariate ragioni, 
nel caso delle priorità date da un motore di ricerca). E' senz'altro 
vero che l'effetto della democrazia è una "censura" dei meno potenti 
che, nello straripare della comunicazione disponibile, oscurano i più 
piccoli fin quasi a renderli invisibili. Un problema del nostro mondo, 
non di quello virtuale, che si ripercuote, ovviamente, anche 
sull'applicazione delle stesse dinamiche in quello virtuale, che poi 
non ne è che un'appendice.

Del resto, effettivamente, quale procedimento alternativo si potrebbe 
trovare?

Anche qui, mi pare, ha ragione Lavo: l'unica alternativa sinora 
praticata è quella di dare la priorità a chi paga di più, anche in 
questo caso, ovviamente, tendenzialmente i più potenti fra i potenti. 
E' la natura stessa del motore di ricerca, che può adoperare solo 
criteri sintattici per la selezione e non categorizzazioni semantiche 
né, tantomeno, valoriali, a non lasciare molte alternative. (Sarebbe 
stupido, del resto, chiedere a un motore di dare risposte ordinandole 
per il loro valore, gli si può solo chiedere di misurare il peso, ma 
quello dell'attribuire valore per noi dei differenti pesi resta un 
lavoro che solo noi possiamo svolgere.) L'alternativa eticamente 
percorribile sarebbe semmai quella del non-motore di ricerca, quella di 
un'insieme di enciclopedie della rete che, in base ai valori indicati 
dall'utente, gli offrano le risposte a essi corrispondenti. Ma qui si 
pone l'altro problema: chi controlla i controllori? E, una volta che li 
si controlla, chi li mantiene? Il lavoro di analisi semantica e 
valoriale del contenuto della rete è immenso. Impossibile pensare di 
assolverlo in modo soddisfacente. Chiedere ai siti e agli utenti di 
specificare un insieme di valori di riferimento, d'altronde, sembra 
un'impresa vana: attualmente impraticabile, difficilmente 
controllabile, tendenzialmente appesantente. Tale opzione, quindi, 
viene a collassare nel semplice elenco di links, magari vasto e ben 
fatto, che significa appunto il non-pescare, il cercare e seguire 
percorsi di senso e di lavoro, il contrario della casualità aperta del 
motore di ricerca. Un percorso di cui la mappa sul sito di rekombinant 
è già un ottimo esempio - per quanto certamente non omnicomprensivo e, 
se vogliamo, discutibile - come anche il ricchissimo insieme di 
riferimenti incrociati di informationguerrilla e altri ancora.

Senza contare che i motori hanno una loro effettiva utilità, anche 
google (beh, non lo uso mai, ma lo userei), anche per individuare siti 
che altrimenti non si troverebbero mai. E allora non ci resta, se 
vogliamo dar risalto alla rete di alternative al potere costituito, che 
far corrispondere alla rete reale la struttura di quella virtuale, al 
lavoro di relazioni quello di links fra siti, etc. in modo da cercare 
di produrre peso e presenza rispetto ai pesanti e ai loro fruitori 
grazie ai contenuti, ma non mi sembra che in questo senso si possa 
pensare di trovare scorciatoie o altre strutture in quella che 
marxianamente è indicabile come una sovrastruttura...

Efraim

===

Esatto, condivido in pieno.
Mi permetto di ritornare a coppe su Google, di fronte ad
argomenti ben piu' importanti, per introdurre un minimo di criterio
sperimentale che, dovrebbe sempre essere usato prima di valutare una 
qualsiasi affermazione.

Reality check!
vediamo quanto e' *democratico* e censorio delle minoranze Google,
vediamo quali sono le url che dominano (risultano le prime facendo una
ricerca) lo spazio delle chiavi di ricerca !!


parola cercata    | *primo* link fornito
- ---------------------|------------------------------------
 carta                      | www.carta.org
contestazione           | www.31febbraio.org/foto_all.asp?ID=4527
tobin                       | http://www.ceedweb.org/iirp/
neoliberista               | 
http://www.tmcrew.org/archiviochomsky/davie.html
manifesto                | http://www.ilmanifesto.it/
guerra                   |
http://www.fut.es/~msanroma/GUERRACIVIL/guerracivil.html

Alla faccia della censura e del controllo corporativo!
Carta.org e' piu' in tema col suo nome che un sito di cartiere, la
Tobin tax (respinta dal suo morale ispiratore) e' piu' rilevante che
l'opera di  Tobin stesso che e' un premio Nobel , ecc ecc 

no comment :)

Lavo

===

- -- 
Marco Valli - Running Debian GNU/Linux
GnuPG key on http://keyserver.autistici.org
- -
"Il patriottismo è l'ultimo rifugio delle canaglie" (Samuel Johnson)
- -
http://www.ecn.org/filiarmonici - per un mondo senza galere
- --
-----BEGIN PGP SIGNATURE-----
Version: GnuPG v1.2.0 (GNU/Linux)

iD8DBQE+AdLtKWzZpd1PVYQRAlWsAJ9EbMFqjEZ2n+aGalODrXD46UzGjwCeJ4Jx
rUieHvpywrLyDQa/KKQzk9Y=
=a193
-----END PGP SIGNATURE-----