[FoLUG][OT] Come funziona Google?
Marco Valli - Cosmo
folug@lists.linux.it
Thu, 19 Dec 2002 15:08:45 +0100
-----BEGIN PGP SIGNED MESSAGE-----
Hash: SHA1
Dalla lista Rekombinant un'interessante discussione sul funzionamento
del motore di ricerca Google e le sue analogie con i sistemi
democratici.
saluti
===
Google si e' affermato verso al fine degli anni 90 come il piu' popolare
search engine disponibile in rete. Il suo successo cosi' come le sue
credenziali "democratiche" si basano su un sistema di computazione dei
link associati alla pagina.
<< PageRank relies on the uniquely democratic nature of the web by using
its vast link structure as an indicator of an individual page's value.
In essence, Google interprets a link from page A to page B as a vote,
by page A, for page B. But, Google looks at more than the sheer volume
of votes, or links a page receives; it also analyzes the page that
casts the vote. Votes cast by pages that are themselves "important"
weigh more heavily and help to make other pages "important." >>
Il problema con questo approccio e' che i siti di maggiore peso, quelli
che sono riferiti da un maggiore numero di link, sono ovviamente i siti
dei maggiori operatori in rete. Il loro "voto" conta di piu' di quello
dei siti piu' piccoli. Il risultato e' il virtuale oscuramento dei siti
minori.
La pretesa "democraticita'" di google si rivela dunque essere
esattamente l'opposto di cio' che dichiara: una funzione del cosidetto
corporate takeover della rete. Il diavolo sta nei dettagli.
Per saperne di piu':
http://www.google-watch.org/pagerank.html
v
===
Ciao Vittorio, permettimi di muovere qualche appunto sulla tua
conclusione a riguardo di Google
>Il problema con questo approccio e' che i siti di maggiore peso, quelli
>che sono riferiti da un maggiore numero di link, sono ovviamente i
>siti dei maggiori operatori in rete. Il loro "voto" conta di piu' di
>quello dei siti piu' piccoli. Il risultato e' il virtuale oscuramento
>dei siti minori.
Ovviamente ??? no non e' una cosa tanto ovvia, anzi!
Il sistema di Pageranking di Google, nasce per risolvere un problema:
quello della rilevanza delle informazioni nelle pagine risultato di una
ricerca. Il problema e' di proporzioni enormi, data l'inefficacia
provata di metodi di autodeterminazione dei contenuti (es: i meta tags)
regolarmente abusati dai nuovi barbari della rete: siti commerciali
"rispettabili" oppure stile "sexy sluts" e privati che creano siti web
senza il benche' minimo rispetto della Netiquette, e spesso neanche la
sua conoscenza. Anche cercare di analizzare i contenuti e' impresa
ardua per una macchina, allo stato attuale e' pressocche' impossibile
farlo efficacemente, e comunque anche quando la tecnologia avanzasse da
quel punto di vista , non essendoci effettiva comprensione dei
significati da parte delle macchine, un siffatto sistema sarebbe
vulnerabile all'astuzia umana piu' degli altri, cosa resta? il
pageranking? esiste un sistema che prescinde dalla comprensione del
contenuto/stile e che sia efficace a parte quelli basati sulla stessa
idea di google?
Prima di Google i motori di ricerca indicizzavano semplicemente le
pagine e poi facevano mercimonio dei primi posti in ogni ricerca, un
mercimonio molto redditizio e molesto per l'utente, che aveva
praticamente annullato i vantaggi di fare una ricerca. Questi gia' poco
utili motori di ricerca,con la bolla dot.com, si trasformarono in
portali, seguendo il bandwagon di chi pensava che ai lobotomizzati
utenti che si voleva creare infarcendo la rete di lustrini e
paillettes, servisse una baby-sitter,un "portale".
Il sistema di Google, quantomeno oggettivo e imparziale, in quanto
basato su regole fissate e non sul mercimonio, semplicemente ha fissato
un nuovo standard di qualita' e di rispetto per l'utente oltreche' di
*stile*. Ha infatti una particolare qualita': FUNZIONA!
Mediamente facendo una ricerca, nei primi dieci link forniti si trovano
almeno 7 o 8 totalmente in topic, e spesso anche quello che si cercava
veramente,l'opzione " mi sento fortunato" che da solo il link piu'
rilevante e' un segno di quanto i creatori confidino nell' efficacia
del Pageranking, e a ragione.
Il fine di un motore di ricerca non e' quello di dare visibilita' ai
siti,o alle persone ma ai *contenuti* (pessimo termine contenuti, eh)
I soggetti su cui opera un motore di ricerca non devono essere i siti,
ma i *contenuti*, i "memi" se preferite , quando si fa una ricerca
sulle megattere non e' importante che venga segnalato il sito di
Peppiniello Grattugia tra gif animate e cazzate, dice due parole su
quando ha fatto la gita in California e ha visto una megattera, ma
piuttosto le pagine che danno reali informazioni e a cui , in un mondo
ideale, molte piu' persone che scrivono sulle balene fanno riferimento
piazzando un link, nei loro *contenuti* web. Siccome dovrebbero
esistere piu' webmaster interessati a cio' che pubblicano, rispetto a
quelli che sono amici personali di Peppino o che tacchinano sua sorella
e vogliono farlo contento, l'efficacia del pageranking e' assicurata
(date queste premesse, e la natura stessa dell'ipertesto).
E dovrebbero esistere anche molti piu' siti con contenuti originali
rispetto a quelli che pedissequamente linkano "portali" amici
altrimenti il problema sarebbe ben maggiore.
Lo stesso vale per i siti commerciali e i portali, che sicuramente sono
una percentuale molto bassa, anche se ricevono molto traffico; quindi
tralasciando gli scambi di favori e/o di soldi ad esempio attraverso
prog di partnership che pero' non credo siano statistic. rilevanti :
- - Se contengono informazioni originali utili meritano di essere linkati
nel *contesto* di info su un alro sito, e quindi di essere in cima alla
lista.
- - Altrimenti, il link e' il risultato di una sudditanza psicologica e/o
mancanza di ragionamento critico,da parte dei webmaster che li linkano,
quindi un problema umano
>La pretesa "democraticita'" di google si rivela dunque essere
>esattamente l'opposto di cio' che dichiara: una funzione del cosidetto
>corporate takeover della rete.
Au contraire,hai dimostrato l'opposto: infatti i problemi del sistema di
Google sono esattamente quelli delle varie forme di rappresentanza
democratica, in particolare quelli legati al fattore umano e alla
manipolazione delle menti. E cosi' anche per l'eventuale cura (se fosse
necessaria): piu' ragione critica e un assunzione della coscienza di se
tanto nel caso dei Netizen, come nei cittadini.
L'unica differenza e' che in rete, l' "uomo nuovo" e' il vecchio utente,
e i nuovi utenti, purtroppo, spesso rappresentano l'uomo consumatore
contemporaneo che adora lustrini, flashes e paillettes.
Lavo
===
No caro Lavo,
non sono d'accordo. Mi sembra sia piuttosto tu a perdere l'oggetto. C'e'
una differenza fondamentale fra l'essere irrilevante (anche se i vari
pippinielli mi stanno simpatici) e l'essere minoritario. E di questo
ultimo io volgio discutere, non del primo. Forme di pesniero
minoritarie non dovrebbero essere discriminate in ragione delle logiche
interne al sistema. Come altrimenti formare dopo cio' che viene dopo ed
al di la' dell'opinione pubblica ? Come si forma cio' che Alex chiamava
in altro contesto "l'opinione diffusa" ? Anche .. Il concetto di
oggettivita' cui ti rifai mi sembra povero. Cero 2+2=4 in Italia cosi'
come nel resto di (questo) universo. Ma il "fatto" che certi siti
abbiano un certo peso dipende per lo piu' da fattori "esterni",
rapporti di potere esistenti nel "mondo reale" di fronte a cui google
volentieri si inchina.
Insomma. Il funzionamente del sistema non e' oggettivo. Meglio questa
oggettivita' non e' che un construtto artificiale la cui logica va
investigata dal punto di vista del mondo "reale", cioe' dei rapporti
sociali che essa oggettiva e riproduce.
ciao
v
===
Devo dire, caro Vittorio, che la tua risposta mi sembra dare ragione a
Lavo: è vero che un procedimento come quello applicato da Google
penalizza, nei risultati, i siti "minoritari", ma è altrettanto vero
che la subordinazione delle minoranze alle maggioranze, il maggior peso
dato a queste, è proprio l'aspetto strutturalmente tipico di ogni forma
di democrazia che non si basi sul procedimento del consenso pieno
(procedimento inapplicabile, ovviamente e per le più svariate ragioni,
nel caso delle priorità date da un motore di ricerca). E' senz'altro
vero che l'effetto della democrazia è una "censura" dei meno potenti
che, nello straripare della comunicazione disponibile, oscurano i più
piccoli fin quasi a renderli invisibili. Un problema del nostro mondo,
non di quello virtuale, che si ripercuote, ovviamente, anche
sull'applicazione delle stesse dinamiche in quello virtuale, che poi
non ne è che un'appendice.
Del resto, effettivamente, quale procedimento alternativo si potrebbe
trovare?
Anche qui, mi pare, ha ragione Lavo: l'unica alternativa sinora
praticata è quella di dare la priorità a chi paga di più, anche in
questo caso, ovviamente, tendenzialmente i più potenti fra i potenti.
E' la natura stessa del motore di ricerca, che può adoperare solo
criteri sintattici per la selezione e non categorizzazioni semantiche
né, tantomeno, valoriali, a non lasciare molte alternative. (Sarebbe
stupido, del resto, chiedere a un motore di dare risposte ordinandole
per il loro valore, gli si può solo chiedere di misurare il peso, ma
quello dell'attribuire valore per noi dei differenti pesi resta un
lavoro che solo noi possiamo svolgere.) L'alternativa eticamente
percorribile sarebbe semmai quella del non-motore di ricerca, quella di
un'insieme di enciclopedie della rete che, in base ai valori indicati
dall'utente, gli offrano le risposte a essi corrispondenti. Ma qui si
pone l'altro problema: chi controlla i controllori? E, una volta che li
si controlla, chi li mantiene? Il lavoro di analisi semantica e
valoriale del contenuto della rete è immenso. Impossibile pensare di
assolverlo in modo soddisfacente. Chiedere ai siti e agli utenti di
specificare un insieme di valori di riferimento, d'altronde, sembra
un'impresa vana: attualmente impraticabile, difficilmente
controllabile, tendenzialmente appesantente. Tale opzione, quindi,
viene a collassare nel semplice elenco di links, magari vasto e ben
fatto, che significa appunto il non-pescare, il cercare e seguire
percorsi di senso e di lavoro, il contrario della casualità aperta del
motore di ricerca. Un percorso di cui la mappa sul sito di rekombinant
è già un ottimo esempio - per quanto certamente non omnicomprensivo e,
se vogliamo, discutibile - come anche il ricchissimo insieme di
riferimenti incrociati di informationguerrilla e altri ancora.
Senza contare che i motori hanno una loro effettiva utilità, anche
google (beh, non lo uso mai, ma lo userei), anche per individuare siti
che altrimenti non si troverebbero mai. E allora non ci resta, se
vogliamo dar risalto alla rete di alternative al potere costituito, che
far corrispondere alla rete reale la struttura di quella virtuale, al
lavoro di relazioni quello di links fra siti, etc. in modo da cercare
di produrre peso e presenza rispetto ai pesanti e ai loro fruitori
grazie ai contenuti, ma non mi sembra che in questo senso si possa
pensare di trovare scorciatoie o altre strutture in quella che
marxianamente è indicabile come una sovrastruttura...
Efraim
===
Esatto, condivido in pieno.
Mi permetto di ritornare a coppe su Google, di fronte ad
argomenti ben piu' importanti, per introdurre un minimo di criterio
sperimentale che, dovrebbe sempre essere usato prima di valutare una
qualsiasi affermazione.
Reality check!
vediamo quanto e' *democratico* e censorio delle minoranze Google,
vediamo quali sono le url che dominano (risultano le prime facendo una
ricerca) lo spazio delle chiavi di ricerca !!
parola cercata | *primo* link fornito
- ---------------------|------------------------------------
carta | www.carta.org
contestazione | www.31febbraio.org/foto_all.asp?ID=4527
tobin | http://www.ceedweb.org/iirp/
neoliberista |
http://www.tmcrew.org/archiviochomsky/davie.html
manifesto | http://www.ilmanifesto.it/
guerra |
http://www.fut.es/~msanroma/GUERRACIVIL/guerracivil.html
Alla faccia della censura e del controllo corporativo!
Carta.org e' piu' in tema col suo nome che un sito di cartiere, la
Tobin tax (respinta dal suo morale ispiratore) e' piu' rilevante che
l'opera di Tobin stesso che e' un premio Nobel , ecc ecc
no comment :)
Lavo
===
- --
Marco Valli - Running Debian GNU/Linux
GnuPG key on http://keyserver.autistici.org
- -
"Il patriottismo è l'ultimo rifugio delle canaglie" (Samuel Johnson)
- -
http://www.ecn.org/filiarmonici - per un mondo senza galere
- --
-----BEGIN PGP SIGNATURE-----
Version: GnuPG v1.2.0 (GNU/Linux)
iD8DBQE+AdLtKWzZpd1PVYQRAlWsAJ9EbMFqjEZ2n+aGalODrXD46UzGjwCeJ4Jx
rUieHvpywrLyDQa/KKQzk9Y=
=a193
-----END PGP SIGNATURE-----