ISISJam3
ISISISISJamJam33
Gennaro Cordasco
GEOGRAPHIC ROUTING IN SOCIAL NETWORKS
David Liben-Nowell, Jasmine Novak, Ravi Kumar, Prabhakar Raghavan, Andrew Tomkins
Proceedings of the National Academy of Sciences, Vol. 102, No. 33. (2005), pp. 11623-11628.
ISISJam3
OUTLINE
� Background
� Small-World
� Milgram Experiment
� Kleinberg’s Model
� LiveJournal� LiveJournal
� GeoGreedy
� Relazione fra amicizia e distanza
� Comparazione fra il modello di Kleinberg e LJ
� Distribuzione dei nodi in LJ
� Rank Based Friendship
09/06/2009 2ISISJam3: Geographic routing in social networks
ISISJam3
SMALL-WORLD: OBIETTIVO
� Trovare un modello che rispecchi le proprietà delle reti sociali
� Si ma… come sono strutturate le reti sociali?
� Intuizione: La maggior parte degli amici di una persona si trovano vicino (in senso geografico o per gusti, affinità ecc.) Esempi sono il vicino di casa, il compagno di scuola, il collega di lavoro.
Dunque le reti sociali sono più o meno 'grid-like':� Dunque le reti sociali sono più o meno 'grid-like':
Da questa osservazione
sembrerebbe che il diametro di
una rete sociale è O(√n)…. ma
non è così
09/06/2009 3ISISJam3: Geographic routing in social networks
ISISJam3
THE MILGRAM'S EXPERIMENT
� Le reti sociali funzionano e funzionano bene. Perché?
� Stanley Milgram (sociologo) condusse il seguente esperimento al fine di intuire il meccanismo alla base del funzionamento delle reti sociali:
� Milgram chiese and alcune persone scelte in maniera casuale in Kansas e Nebraska di inviare una lettera ad una persona (agente di Kansas e Nebraska di inviare una lettera ad una persona (agente di cambio) a Boston.
� Le uniche informazioni date a queste persone erano nome cognome e professione del destinatario.
� L‘unica operazione possibile per consegnare la lettera era di inoltrare la lettera ad una persona conosciuta.
09/06/2009 4ISISJam3: Geographic routing in social networks
ISISJam3
THE MILGRAM'S EXPERIMENT
� Le lettere che raggiunsero il target lo raggiunsero in media in 5.5 < 6 passi.
� Così venne coniato il termine "6 degrees of separation"
� Questo valore era di gran lunga inferiore a quello che ci si attendeva dalla assunzione che le reti sociali hanno una struttura 'grid-like'!
Ma il risultato di Milgram è importante perché non solo dimostra � Ma il risultato di Milgram è importante perché non solo dimostra che le reti sociali hanno un diametro atteso molto piccolo. Esso dimostra inoltre che esiste un algoritmo di routing (diverso dal flooding) semplice (lo conoscevano tutti) che permette di scoprire queste path corte.
Target raggiunto solo da 64 lettere su 296
09/06/2009 5ISISJam3: Geographic routing in social networks
ISISJam3
MODELLI TRADIZIONALI
� Random Graph� Gli archi sono creati in maniera casuale � Bassa average path length (≤ log n/log k) ☺� Basso coefficiente di Clustering C(G) ≈ k/n �
� Regular Networkk è il grado medio
Nessuno di questimodelli è in gradodi simulare le reti
reali
� Regular Network� Gli archi seguono una struttura� Alto average path length �
� Alto coefficiente di Clustering ☺
k è il grado mediodei nodi
09/06/2009 6ISISJam3: Geographic routing in social networks
ISISJam3
SMALL-WORLD NETWORKS
� Secondo Watts and Strogatz [WS98] una rete si dice Small world se rispetta le seguenti caratteristiche:� Ha un numero elevato di nodi (n >> 1)� Il grado dei nodi è basso (grado medio k << n)
� Ha un coefficiente di Clustering elevato (molto più grande di quello dei grafi casuali)
� Ha un coefficiente di Clustering elevato (molto più grande di quello dei grafi casuali)
� Ha una APL bassa (≈ log n, simile a quella di un grafo casuale)
09/06/2009 7ISISJam3: Geographic routing in social networks
ISISJam3
Coefficiente di Clustering vs Average Path length
WATTS AND STROGATZ MODEL
� Il diagramma mostra l‘evoluzione del coefficiente di Clustering e dell‘average pathlength in funzione di p.
� Risultati: Per piccoli valori di p
p (log scale)
Small World
� Risultati: Per piccoli valori di p il coefficiente di Clusteringrimane alto mentre l‘averagepath length decresce molto velocemente.
Le reti Small World networks combinano un alto
coefficiente di clustering con una bassa average path
length.
ISISJam3
IL MODELLO DI KLEINBERG
� Un aspetto fondamentale dell‘esperimento di Milgram è che le persone sono capaci di trovare le path ottimali (o quasi):� Da notare che ogni persona ‘vede‘ solo una piccola parte della
rete, vale a dire solo i propri vicini, ed usa quindi un algoritmo di routing decentralizzato.di routing decentralizzato.
� Il modello di Kleinberg può essere sintetizzato in questo modo:� Consideriamo un nodo v in una matrice d-dimensionale: v = (v1, v2, …, vd). vi è la posizione di v nella dimensione i.
� Ogni nodo conosce la proprio posizione, la posizione del target e la posizione dei propri vicini.
� Ogni nodo inoltra il messaggio al vicino u che si trova più vicino al target. La distanza fra due nodi d(v,t) è data dalla somma delle differenze delle posizioni (in valore assoluto) su ogni dimensione d(v,t) =Σdi=1|vi-ti| (Manhattan Distance).
09/06/2009 9ISISJam3: Geographic routing in social networks
ISISJam3
IL MODELLO DI KLEINBERG
� Consideriamo n nodi su una matrice a d dimensioni, ogni nodo ha
� (2d) vicini sulla griglia� k contatti (detti long-range) (ogni nodo v stabilisce k link
indipendentemente utilizzando una distribuzione di probabilità p(d(u,v)))
ISISJam3: Geographic routing in social networks
Di solito p(d(u,v)) è proporzionale a d(u,v)-α
coefficiente di normalizzazione
λ = ∑v d(u,v)-α
09/06/2009 10
ISISJam3
IL MODELLO DI KLEINBERG
� Teorema: L‘algoritmo di routing greedy è capace di trovare delle path brevi, vale a dire, path di lunghezza O(log2 n), da ogni sorgente a ogni destinazione se α = d.
p(d(u,v))= d(u,v)-α/λ
λ = ∑v d(u,v)-α
p(d(u,v))= d(u,v)-d /λ
λ = ∑v d(u,v)-d
ISISJam3
OUTLINE
� Background
� Small-World
� Milgram Experiment
� Kleinberg’s Model
� LiveJournal� LiveJournal
� GeoGreedy
� Relazione fra amicizia e distanza
� Comparazione fra il modello di Kleinberg e LJ
� Distribuzione dei nodi in LJ
� Rank Based Friendship
09/06/2009 12ISISJam3: Geographic routing in social networks
ISISJam3
LIVEJOURNAL
� LiveJournal (LJ) è il nome di un provider di weblog che permette agli utenti Internet di mantenere un blog online.
� Il software lato Server è open source. Fornisce anche delle API che permettono di scoprire le relazioni fra gli utenti.che permettono di scoprire le relazioni fra gli utenti.
� Feb, 2004:
� 1,312,454 bloggers
� 495,836 hanno fornito la loro posizione geografica nel loro profilo e si trovano negli USA.
� 384,507 (77.6%) costituiscono un grafo connesso
� 3,959,440 link (8 link in media per nodo)
09/06/2009 13ISISJam3: Geographic routing in social networks
ISISJam3
DEGREE DISTRIBUTION
� Distribuzione di tipo log-normal (invece che powerlaw)
09/06/2009 14ISISJam3: Geographic routing in social networks
ISISJam3
OBIETTIVI
� Effettuare un esperimento simile a quello di Milgram sul grafo ottenuto da LJ:
� Non è necessaria la collaborazione “volontaria” degli utenti (ci aspettiamo un percentuale di successo maggiore).
� E’ possibile implementare diversi algoritmi e testare le loro � E’ possibile implementare diversi algoritmi e testare le loro performance sullo stesso grafo.
09/06/2009 15ISISJam3: Geographic routing in social networks
ISISJam3
GEOGREEDY
� Partendo da un nodo sorgente ed un nodo destinazione scelti a caso.
� Ad ogni passo il nodo corrente contatta il vicino più vicino al nodo destinazione.
� Ci fermiamo quando raggiungiamo la città del target.
� GeoGreedy può fallire!!! (nessuno dei vicini permette di ridurre la distanza dal target).
09/06/2009 16ISISJam3: Geographic routing in social networks
ISISJam3
GEOGREEDY
� 500.000 tentativi
� 13% successo, media 4.12, deviazione standard 2.54
09/06/2009 17ISISJam3: Geographic routing in social networks
ISISJam3
GEOGREEDYMOD
� GeoGreedyMod: se il messaggio non può avanzare scegli a caso uno dei nodi nella tua stessa città e riparti da li:
� 80% successi
� Media 16.74
09/06/2009 18ISISJam3: Geographic routing in social networks
ISISJam3
RELAZIONI FRA AMICIZIA E DISTANZA
� Esiste “in qualche maniera” una relazione fra la distanza geometrica fra due nodi u e v e la probabilità che questi nodi siano amici
� Per ogni distanza δ, sia P(δ) il numero di link (u,v) tali che d(u,v)= δ
� Come previsto nel modello di Kleinberg al crescere di δ, P(δ) decresce
La tecnologia
09/06/2009 19ISISJam3: Geographic routing in social networks
La tecnologiapermette di
ridurre le distanzema non le annulla
ISISJam3
RELAZIONI FRA AMICIZIA E DISTANZA
� Analizzando nel dettaglio la figura si intuisce che per valori grandi di δ, la distanza non incide sulla probabilità che ci sia un link
� Ipotesi: P(δ)= ε + f(δ), ε viene calcolato campionando P(δ) per δgrande (più di 1000 km)
� ε=5.0x10-6 (la parte di P(δ) che non dipende dalla distanza)
Considerando che ogni nodo ha in media 8 link e che di questi 2.5 in media � Considerando che ogni nodo ha in media 8 link e che di questi 2.5 in media dipendono solo da ε, si può affermare che il 70% dei link è dipendente dalla distanza fra i nodi.
20
ISISJam3
RELAZIONI FRA AMICIZIA E DISTANZA
� P(δ)= ε + f(δ),
� Consideriamo adesso f(δ),
� Secondo il modello teorico definito da Kleinberg f(δ) dovrebbe essere circa 1/δ2
(considerando la superficie terrestre come una superficie piana bidimensionale)
� Inoltre se f(δ) = 1/δα con α ≠ 2, allora GEOGreedy non dovrebbe funzionare.
� Ma f(δ) = 1/δ1.2 quindi ci troviamo a una contraddizione!!!!
21
P(δ)= ε + f(δ),
ISISJam3
OUTLINE
� Background
� Small-World
� Milgram Experiment
� Kleinberg’s Model
� LiveJournal� LiveJournal
� GeoGreedy
� Relazione fra amicizia e distanza
� Comparazione fra il modello di Kleinberg e LJ
� Distribuzione dei nodi in LJ
� Rank Based Friendship
09/06/2009 22ISISJam3: Geographic routing in social networks
ISISJam3
DISTRIBUZIONE DEI NODI
Distribuzione deinodi non uniforme
09/06/2009 23ISISJam3: Geographic routing in social networks
ISISJam3
RANK BASED FRIENDSHIP (RBF) MODEL
� Idea: La distanza assoluta fra i nodi non è sufficiente a modellare i legami, è necessario prendere in considerazione anche la densità della popolazione:
� Formalmente, il rango di v rispetto ad u è definito come
� Nel modello RBF, la probabilità che ci sia un link da u a v
� Il modello RBF comprende il modello di Kleinberg (quando il numero di dimensioni è costante).� In una griglia a s=O(1) dimensioni, ranku(v) ≈ O(δs) (dove δ=d(u,v) sulla
griglia)
09/06/2009 24ISISJam3: Geographic routing in social networks
ISISJam3
RANK BASED FRIENDSHIP (RBF) MODEL
� La dimensione frazionale (fractional dimension) di una rete è definita come l’esponente α tale che ranku(v) ≈ c × d(u,v)α
� Nel caso di LJ α=0.8
� Teorema
Sia N una griglia a k dimensioni e sia P una popolazione di di n persone, distribuita in maniera arbitraria su N, che utilizza una rankbased friendship. Utilizzando l’algoritmo GEOGREEDY, la distanza attesa di una path fra due persone s e t ∈ P è c × log3 n
(c è indipendente da n,N,P, ma dipende da k).
09/06/2009 25ISISJam3: Geographic routing in social networks
ISISJam3
RANK BASED FRIENDSHIP (RBF) MODEL
Teorema
Sia N una griglia a k dimensioni e sia P una popolazione di di n persone, distribuita in maniera arbitraria su N, che utilizza una rank based friendship. Utilizzando l’algoritmo GEOGREEDY, la distanza attesa di una path fra due persone s e t ∈ P è c × log3 n
(c è indipendente da n,N,P, ma dipende da k).
Prova
Scegliamo s e t in maniera casuale
09/06/2009 26ISISJam3: Geographic routing in social networks
s
t
d(s,t)<2i
2i-1<d(s,t)<2i
Diametro 2i-1
Pr[sfera blu]=(c log2 n)-1
ISISJam3
RANK BASED FRIENDSHIP (RBF) MODEL
� Teorema
Sia N una griglia a k dimensioni e sia P una popolazione di di n persone, distribuita in maniera arbitraria su N, che utilizza una rankbased friendship. Utilizzando l’algoritmo GEOGREEDY, la distanza attesa di una path fra due persone s e t ∈ P è c × log3 n
(c è indipendente da n,N,P, ma dipende da k).(c è indipendente da n,N,P, ma dipende da k).
� Differenze rispetto al modello di Kleinberg
� O(log3 n) vs O(log2 n)
� Expected APL vs Expected diameter
� dipende da k (# dimensioni) vs non dipende da k.
09/06/2009 27ISISJam3: Geographic routing in social networks
ISISJam3
RBF AND LJ
� Dimensione della griglia = N1/2 × N1/2
� Ogni posizione (x,y) è caratterizzata da una popolazione p(x,y) che corrisponde al
numero di nodi all’interno della cella (∑(x,y) p(x,y) = n)
� Si assume p(x,y)>0
Ogni nodo ha 4 connessioni N S W E,
scegliendo un nodo a caso fra le celle vicine
09/06/2009 29ISISJam3: Geographic routing in social networks
scegliendo un nodo a caso fra le celle vicine
Una ulteriore connessione è scelta usando il rank
Non ci sono dati sufficienti per calcolare il rango corretto di tutti. (Si usa un rango medio)
Dimensione media delle celle 1,300.
ISISJam3
CONSIDERAZIONI
� Ancora non esiste un modello universalmente riconosciuto per descrivere le reti sociali
� Il risultato principale di questo lavoro è che il modello di Kleinberg ha dei limiti.
� RBF è un passo avanti, ma non basta!!!� RBF è un passo avanti, ma non basta!!!
09/06/2009 32ISISJam3: Geographic routing in social networks