[Tech] Re: conettivita' di internet

Franco Bagnoli bagnoli@dma.unifi.it
Gio 10 Maggio 2001 12:34:25 CEST


Allora, per cominciare devo dire che il flug e golem non deludono 
mai (ma non si potrebbero avere delle liste comuni? mi immagino che
molti ricevano messaggi doppi.
flug-tech potrebbe diventare tlug-tech (toscana linux user groups)
e ci potrebbero essere una tlug-project lists...)

Cerco di spiegare quello che voglio fare: 

1) il comportamento di molti fenomeni naturali dipende dal tipo di
connettivita' della rete (grafo) su cui "vivono". Per chi e' ferrato in
matematica, la ragione profonda di questa dipendenza e' che tantissimi
fenomeni possono essere ricondotti a (o approssimati da) una equazione in
cui compare l'operatore Laplaciano.  Mentre in un reticolo regolare questo
operatore e' lo stesso in ogni punto (proprio perche' il reticolo e'
regolare), in un grafo cambia da punto a punto (anzi, da collegamento a
collegamento). Per fortuna i dettagli del grafo non contano molto per le
proprieta' a grande scala (per esempio: i pattern diffusivi delle hoax).

2) Quindi in prima approssimazione e per un determinato intervallo di
tempo (una settimana, un mese..)  vorrei applicare il seguente algoritmo
al file di log della posta di un provider:

  2.1) assegno un identificativo i ad ogni utente di un certo provider su
       cui sto facendo l'analisi
  2.2) per ogni mail spedita (o ricevuta) assegno un identificativo j ad
       ogni destinatario (in modo da poter misurare anche l'intensita' del
       collegamento i-j), 
       Questi identificativi i, j possono essere semplicemente l'indirizzo
       di posta elettronica, tenuto conto degli alias, o un digest MD5
       dell'indirizzo in modo da renderlo anonimo, vedere al punto 3 
  2.3) mi calcolo J(i,j) che e' il numero di mail mandate da i a j.
  2.4) mi calcolo Z(i) = somma su j di J(i,j), connettivita' del nodo i
       (in realta' la connettivita' topologica e' in numero di link, 
       quella metrica e' il numero di link per l'intensita' del link, 
       ma famo a capissi)
  2.5) mi calcolo alcune quantita' "medie": la distribuzione 
       di Z, l'asimmetria di J (ovvero quanta e' la differenza tra mail
       mandate e ricevute), la distribuzione degli overlap tra i e j
       (ovvero quante mail mandate da i e da j vanno a/provengono da un
       comune destinatario k, sommato su k), ecc.
 
3) il problema che mi pongo per la privacy (e per la collaborazione dei
provider) e' che per fare un bel lavoro bisognerebbe avere J, non solo le
quantita' medie, in modo da poter complementare i dati di piu'
provider. Questo e' importante perche' i dati dei provider piccoli credo
che diano delle medie molto fluttuanti, soprattutto sulle quantita' 
piu' delicate come l'overlap tra gli utenti. 

Pero' per fare questo "complemento" ho bisogno di poter identificare
univocamente ogni utente. E' vero che usando il digest md5 l'utente e'
anonimo, pero' e' anche vero che e' unico, per cui potrei calcolarmi il
digest di un indirizzo da me conosciuto e sapere quante mail ha mandato o
se ha mandato una mail ad un altro utente da me conosciuto (di cui posso
calcolare il digest). Non vedo soluzione a questo problema. Forse poteri
chiedere agli utenti che vogliono collaborare di mandare un messaggio al
loro provider che lo autorizzi a concedermi questi dati, ma dovrei farlo
per ogni coppia i,j, ehm... un bel progettone...

4) Senza avere accesso a J, usando solo le informazioni medie
(assolutamente anonime, a questo punto) dovrei puntare sui siti con piu'
grosso volume di traffico: forse i nodi GARR o qualcosa del genere
(suggerimenti?). Ovviamente non tralascio i contributi dei piccoli: il
traffico locale non passa dai grandi nodi.

-------------------------------------------------------------------------
Probabilmente questa discussione non interessa a tutti i partecipanti
alle liste, e non mi va di riempire le caselle postali, per cui vorrei
spostarla in un posto piu' adatto. Chi e' interessato mi scriva
personalmente, cosi' posso comunicargli il nuovo "sito".

------------------------------------------------------------------------
On Wed, 9 May 2001, Marco Ermini wrote:

> > > > Infine: io ovviamente userei uno script bash o perl, ma per i lmondo
> > > > windows? (ma esistono server di posta microsoft?)
> 
> Spero stia scherzando, Exchange serve migliaia di utenti. Esistono anche altri
> server ma sono minoritari
> 
> Non puoi monitorare exchange col perl... monitorare un'applicazione come
> Exchange o IIS sotto Win e' complicato. Non e' questa la sede corretta per
> parlarne, credo, se vuoi posso darti ragguagli...

ma exchange ha o puo' avere un file di log o no? 

-- 
Franco Bagnoli
Dipartimento di Matematica Applicata "G. Sansone"
Universita' di Firenze, Via S. Marta, 3 I-50139 Firenze, Italy
tel. +39 0554796422, fax: +39 055471787
e-mail: bagnoli@dma.unifi.it








Maggiori informazioni sulla lista flug-tech