28
PAGE RANK Duílio Assis Nobre [email protected]

PAGE RANK Duílio Assis Nobre [email protected]

Embed Size (px)

Citation preview

Page 1: PAGE RANK Duílio Assis Nobre duilioanss@gmail.com

PAGE RANKDuílio Assis Nobre

[email protected]

Page 2: PAGE RANK Duílio Assis Nobre duilioanss@gmail.com

SUMÁRIO

Introdução a Processos Estocásticos- Definição e exemplos

Cadeias de Markov- Definição e exemplos- Probabilidade de Transição- Probabilidades Estacionárias

Aplicação na área de computação: Page Rank

Referências

Page 3: PAGE RANK Duílio Assis Nobre duilioanss@gmail.com

INTRODUÇÃO A PROCESSOS ESTOCÁSTICOS

Definição

Exemplos:- X(t) representa o número de clientes numa loja no

instante t;- X(t) representa a cotação de uma ação no fim do dia t;- X(t) representa o nível de stock de um determinado

artigo no fim do dia t;

Page 4: PAGE RANK Duílio Assis Nobre duilioanss@gmail.com

CADEIAS DE MARKOV

Definição

Page 5: PAGE RANK Duílio Assis Nobre duilioanss@gmail.com

CADEIAS DE MARKOV

Considere o seguinte exemplo:

- Para cada pessoa que compre licor da família F há 90% de probabilidade de o próximo licor que comprar seja licor Florescente.

- Já para cada pessoa que compre o licor da família P há só 80% de o próximo comprado seja ainda o licor Petalado.

Page 6: PAGE RANK Duílio Assis Nobre duilioanss@gmail.com

CADEIAS DE MARKOV

Matriz de transição de estados:

Outra forma de representação, diagrama de tansições:

Page 7: PAGE RANK Duílio Assis Nobre duilioanss@gmail.com

CADEIAS DE MARKOV

Portanto a probabilidade de transição em n passos é dada por:

Probabilidade de Transição:

Page 8: PAGE RANK Duílio Assis Nobre duilioanss@gmail.com

CADEIAS DE MARKOV

Matriz de transição para 3 passos:

Visto isso, podemos dizer que se P for uma matriz estocástica, então qualquer potência de P o é, pois:

Page 9: PAGE RANK Duílio Assis Nobre duilioanss@gmail.com

CADEIAS DE MARKOV

Probabilidades Estacionárias:- Probabilidades de transição em dezesseis períodos:

A esta probabilidade chama-se probabilidade estacionária do estado j e representa-

se por חj. Por outras palavras,

Page 10: PAGE RANK Duílio Assis Nobre duilioanss@gmail.com

CADEIAS DE MARKOV

- Corresponde a um sistema de equações de solução indeterminada:

Page 11: PAGE RANK Duílio Assis Nobre duilioanss@gmail.com

CADEIAS DE MARKOV

Relembrando o primeiro exemplo, quais são as probabilidades estacionárias?

O que significam estes valores?

Page 12: PAGE RANK Duílio Assis Nobre duilioanss@gmail.com

PAGE RANK

Motivação:

- Dexar claro o que é Page Rank e sua importância

- Mostrar como o é calculado para cada página

Page 13: PAGE RANK Duílio Assis Nobre duilioanss@gmail.com

PAGE RANK

Page 14: PAGE RANK Duílio Assis Nobre duilioanss@gmail.com

PAGE RANK

A formula:

PR(A) = (1-d) + d (PR(T1)/C(T1) + … + PR(Tn)/C(Tn))

- PR(Tn): Importância de cada página

- C(Tn): Número de links saindo de cada página

- d e (1-d): valores de Teleporting

Page 15: PAGE RANK Duílio Assis Nobre duilioanss@gmail.com

PAGE RANK

Teleporting:

- Uma caminha aleatória.

- Uma caminha aleatoria normal.

Page 16: PAGE RANK Duílio Assis Nobre duilioanss@gmail.com

PAGE RANK

Exemplo 1:

Pelo gráfico temos que C(A) = 1 e C(B) = 1

Certo, mas quais valores iniciais de PR(A) e PR(B)?

d = 0.85

PR(A) = (1 – d) + d(PR(B)/1)

PR(B) = (1 – d) + d(PR(A)/1)

Page 17: PAGE RANK Duílio Assis Nobre duilioanss@gmail.com

PAGE RANK

PR(A) = 0.15 + 0.85 * 1/1= 1

PR(B) = 0.15 + 0.85 * 1/1= 1

Vamos começar com ambos iguais a 1:

Agora, vamos considerar ambos inicialmente iguais a 0:

PR(A) = 0.15 + 0.85 * 0.2775= 0.385875

PR(B) = 0.15 + 0.85 * 0.385875= 0.47799375

PR(A) = 0.15 + 0.85 * 0/1= 0.15

PR(B) = 0.15 + 0.85 * 0.15/1= 0.2775

Repetindo as contas:

Page 18: PAGE RANK Duílio Assis Nobre duilioanss@gmail.com

PAGE RANK

PR(A) = 0.15 + 0.85 * 40/1= 34.15

PR(B) = 0.15 + 0.85 * 34.15/1= 29.1775

Agora, vamos considerar ambos inicialmente iguais a 40:

Repetindo as contas:

PR(A) = 0.15 + 0.85 * 29.1775/1= 24.950875

PR(B) = 0.15 + 0.85 * 24.950875/1= 21.35824375

Page 19: PAGE RANK Duílio Assis Nobre duilioanss@gmail.com

PAGE RANK

Começando com ambos 0, vamos fazer um número considerável deinterações . Abaixo segue apenas os resultados:

PR(A): 0.00000 PR(B): 0.00000PR(A): 0.15000 PR(B): 0.27750PR(A): 0.38588 PR(B): 0.47799PR(A): 0.55629 PR(B): 0.62285 PR(A): 0.67942 PR(B): 0.72751 PR(A): 0.76838 PR(B): 0.80313PR(A): 0.83266 PR(B): 0.85776PR(A): 0.87909 PR(B): 0.89723PR(A): 0.91265 PR(B): 0.92575PR(A): 0.93689 PR(B): 0.94635PR(A): 0.95440 PR(B): 0.96124PR(A): 0.96705 PR(B): 0.97200 PR(A): 0.97620 PR(B): 0.97977 PR(A): 0.98280 PR(B): 0.98538 PR(A): 0.98757 PR(B): 0.98944 PR(A): 0.99102 PR(B): 0.99237 PR(A): 0.99351 PR(B): 0.99449 PR(A): 0.99531 PR(B): 0.99602 PR(A): 0.99661 PR(B): 0.99712PR(A): 0.99755 PR(B): 0.99792

Visto os resultados das 3 suposiçõesde valores iniciais a PR(A) e PR(B), a que conclusão podemos chegar?

Page 20: PAGE RANK Duílio Assis Nobre duilioanss@gmail.com

PAGE RANK

Exemplo 2:

Exemplo 3:

Page 21: PAGE RANK Duílio Assis Nobre duilioanss@gmail.com

PAGE RANK

Quais seriam os PRs das páginas do exemplo 3?

PR(A) = (1-d) + d (PR(B)/C(B) + … + PR(Spam n)/C(Spam n))

Pegando todos os 1000 spams e isolando temos:

PR(A) = (1-d) + d (PR(B)/C(B) + 1000(PR Spam) /C(Spam ))

Qual seria o efeito desse fator 1000 no cálculo do PR(A) e PR(B)?

Fazendo algumas contas, temos:

PR(A): 0.00000 PR(B): 0.00000 PR(Spams): 0.00000 PR(A): 0.15000 PR(B): 0.27750 PR(Spams): 0.15024 PR(A): 127.85049 PR(B): 108.82292 PR(Spams): 0.24250 PR(A): 206.27456 PR(B): 175.48338 PR(Spams): 0.29916

Page 22: PAGE RANK Duílio Assis Nobre duilioanss@gmail.com

PAGE RANK

Page 23: PAGE RANK Duílio Assis Nobre duilioanss@gmail.com

PAGE RANK

Qual seria a sua importância de um modo geral?

O que seria um possível defeito?

Page 24: PAGE RANK Duílio Assis Nobre duilioanss@gmail.com
Page 25: PAGE RANK Duílio Assis Nobre duilioanss@gmail.com
Page 26: PAGE RANK Duílio Assis Nobre duilioanss@gmail.com
Page 27: PAGE RANK Duílio Assis Nobre duilioanss@gmail.com

REFERÊNCIAS

http://www.ianrogers.net/google-page-rank/

http://www.youtube.com/watch?v=FNjQ-itLuBY&feature=related

- Chave de busca no YouTube: Como funciona el algoritmo PageRank de Google

Page 28: PAGE RANK Duílio Assis Nobre duilioanss@gmail.com

PAGE RANKDuílio Assis Nobre

[email protected]