Upload
internet
View
123
Download
2
Embed Size (px)
Citation preview
Probabilidade
O que é probabilidade ?
• Experimento aleatório: é um experimento no qual podemos descrever o conjunto de todos os resultados possíveis, mas não podemos dizer, a priori, qual desses resultados vai acontecer.
• Espaço Amostral (Ω): é o conjunto de todos os possíveis resultados do aleatório.
• Evento (A, B, C, etc): é um subconjunto do espaço amostral.
O que é probabilidade ?
• Seja Ω um espaço amostral finito uniforme e seja A um evento qualquer desse espaço. A probabilidade de A, denotada por P(A), é dada por:
• onde #Ω é o número de resultados possíveis do experimento e #A é o número de resultados favoráveis à ocorrência do evento A. É claro que
)(#
)(#)(
AAP
1)(0 AP
Conceito de Frequência de Probabilidade
• Suponha que o experimento foi repetido n vezes, sempre sob as mesmas condições, e que o evento A ocorreu m vezes entre essas n realizações do experimento.Então, a fração m/n é uma boa aproximação para a probabilidade de A, se o numero de n de repetições for bastante grande:
n
mAP )(
Propriedades básicas da probabilidade
a) P(Ω)=1 : Probabilidade de ocorrência de um evento certo.
b) P(Ø) = 0 : Probabilidade de ocorrência de um evento impossível.
c) Se o evento A e B são mutuamente excludente: P (A ou B) = P(A)+P(B)
d) Se A e B podem ocorrer simultaneamente : P (A ou B) = P(A) + P(B) – P(A e B)
e) P(Ac )=1-P(A)
Variáveis Aleatórias
Conceitos
• Uma variável aleatória (v.a) é uma função que associa cada elemento de um espaço amostral a uma número real.– Variáveis aleatórias discreta: Os valores que ela
pode assumir pertencem a um conjunto enumerável E de números reais
– Variáveis aleatórias contínua: Para que a probabilidade de ela pertencer a um conjunto de números reais seja estritamente positiva, esse conjunto deve conter dentro de si um intervalo
Exemplos
1) Experimento : jogar 1 dadoVariável Aleatória: X = “ o dobro do número obtido menos 1” X : {1, 2, 3, 4, 5, 6} {1, 3, 5, 7, 9, 11}
2) Experimento : jogar 4 moedas (C: Cara e K: Coroa)Variável Aleatória: Y = “ números de caras obtidas”Y : {CCCC, CKCC, ..., KKKK} {0, 1, 2, 3, 4}
Função Densidade Probabilidade
x P(x)1 1/63 1/65 1/67 1/69 1/611 1/6
y P(y)0 1/61 4/62 6/163 4/164 1/16
Ex. 1 DadoEx. 2 Moeda
Caso Discreto
• A função de probabilidade p corresponde à variável aleatória discreta X associada a cada número real x a probabilidade de que a variável X assuma aquele valor x.
x→p(x) = P[X=x]• A função de distribuição acumulada F
corresponde à variável aleatória discreta X é definida por F(x)=P[X≤x], para todo x real.
Medidas de Centralizada e de Dispersão
• Média ou Esperança de uma variável aleatória discreta– Se X é uma variável aleatória discreta que assume
os valores x1, x2, x3, ...,xN, com probabilidade p(x1), p(x2), p(x3), ...,p(xN) respectivamente, então sua média ou esperança é:E(A)= x1 p(x1) + x2p(x2) + x3p(x3)+ ... + xN p(xN)
Medidas de Centralizada e de Dispersão
• Variância de uma variável aleatória discreta– Se X é uma variável aleatória discreta que assume os
valores x1, x2, x3, ...,xN, com probabilidade p(x1), p(x2), p(x3), ...,p(xN) respectivamente, então a variancia é calculada por:Var (X)= (x1 – E(X))2.p(x1) + (x2 – E(X))2.p(x2) + ... + + (xN – E(X))2.p(xN)
• Desvio padrão de uma variável aleatória discreta– )()( XVarXDP
Medidas de Centralizada e de Dispersão
• Coeficiente de variação de uma variável aleatória discreta e igual ao quociente entre o desvio-padrão e a média CV(X)=DP(X)/EX
Exemplos
• Em um determinado condomínio residencial: 30% das famílias não tem filhos, 40% tem um filho, 20% têm dois filhos e 10 têm mais de três filhos
X 0 1 2 3
P(x)=P(X=x) 0,3 0,4 0,2 0,1
F(x)=P(X≤x) 0,3 0,7 0,9 1,0
Distribuições Comuns de Variáveis Aleatórias Discretas
1. Constante
2. Uniforme
3. Bernoulli
4. Binomial
5. Geometrica
6. Poisson
Variável Aleatória Constante
• fdp
• FDC
c
1.0
1.0
c
Distribuição Discreta Uniforme
• A v.a. discreta X que assume n valores discretos com probabilidade pX(i) = 1/n, 1 i n
• fdp
• FDC:
contráriocaso
Xxsenxp i
iX ,0
,/1)(
n
tiptF
t
iX
1
)()(
Variável de Bernoulli
– V.A gerada por um experimento único de Bernoulli tem um resultado binário {1, 0} ou {sucesso, falha}
– A v.a. binária X é chamada variável de Bernoulli tal que:
–Função de massa de probabilidade:
)0(1
)1(
XPpq
XPp
Distribuição de Bernoulli
• FDC
x0.0 1.0
q
p+q=1
0
Binomial• A v.a. X representa o número de sucessos em uma
sequência de experimentos de Bernoulli.• Todos experimentos são independentes.• Cada resultado é um “sucesso” ou “falha”.• A probabilidade de sucesso de um experimento é
dado por p. A probabilidade de uma falha é 1- p.• Uso do modelo: número de processadores “down”
num cluster; número de pacotes que chegam ao destino sem erro.
Distribuição Binomial
A distribuição binomial com parâmetros n ≥ 0 e 0 < p < 1, é
A média e variância da binomial são:
p xn
xp px n x( ) ( )
1
np np p2 1( )
V.A. Binomial: fdp
pk1 2,86102E-052 0,0003862383 0,0030899054 0,0162225 0,05839926 0,1459980017 0,2502822888 0,2815675749 0,187711716
10 0,056313515
DISTRBINOM (núm_s;tentativas;probabilidade_s; cumulativo)
0
0.2
0.4
0.6
0.8
1
1.2
0 1 2 3 4 5 6 7 8 9 10
x
CDF
V.A. Binomial: FDC
1 2,86102E-05 2,86102E-052 0,000386238 0,0004148483 0,003089905 0,0035047534 0,016222 0,0197267535 0,0583992 0,0781259546 0,145998001 0,2241239557 0,250282288 0,4744062428 0,281567574 0,7559738169 0,187711716 0,943685532
10 0,056313515 0,999999046
Exemplo
• Um sistema de segurança consiste em 4 alarmes (idênticos) de pressão alta, com probabilidade de sucesso p = 0,8 (cada um). Qual a probabilidade de se ter exatamente 3 alarmes soando quando a pressão atingir o valor limite ?
S1 S2 S3 F4 0,8 x 0,8 x 0,8 x 0,2 = 0,1024S1 S2 F3 S4 0,8 x 0,8 x 0,2 x 0,8 = 0,1024S1 F2 S3 S4 0,8 x 0,2 x 0,8 x 0,8 = 0,1024F1 S2 S3 S4 0,2 x 0,8 x 0,8 x 0,8 = 0,1024
P(3) = 4 x (0,8)3 x (1 - 0,8) 1
= 0,4096
Distribuição de Poisson• Número de eventos independentes que
ocorrem em um intervalo de tempo
• Número de chegadas em um servidor em 1 hora
• Número de erros de impressão em uma página de um livro
= # médio de eventos que ocorrem no período
• Aproximação para VA Binomial com n grande e p pequeno
• Se X = Binomial(n,p), X Poisson( = np)
Poisson: propriedades• Considere que um servidor espera receber 100 transações em
um minuto:– = 100 (constante)
• Espera-se que:– O início de cada transação seja independente dos outros; – Para cada pequeno intervalo de tempo t, a probabilidade de
uma nova transação chegar seja t– A probabilidade de chegar duas transações ao mesmo tempo
seja zero! • O processo de Poisson tem as propriedades acima• A VA X~Poisson representa o número de transações que chegam
durante um período t.
VA Poisson: Aplicacao• A V.A. de Poisson é boa para modelar vários fenômenos, como
o número de transações que chegam a um servidor em uma hora, ou o número de queries que chegam a uma máquina de busca em 1 minuto ou número de pacotes que chegam num roteador em 1 segundo.
• Muito comumente usado para modelar chegada de sessões de usuários – servidores Web, multimídia, banco de dados, ftp, e-mail
• Sessões são iniciadas por usuários– Chegada de duas sessões tendem a ser independentes:
Poisson é uma boa aproximação• Contra-exemplo:
– Chegada de requisições em um servidor Web– Premissa de independência não é válida: existe
dependência entre requisições para o arquivo HTML e as imagens embutidas nele
• Função de densidade de probabilidade (fdp):
• FDC:
k!
)( )(
ktektNPp t
k
k!)(
0
k
x
k
t texF
Distribuição de Poisson
Poisson
• Uma v.a. de Poisson X tem sua fdp:
Onde > 0 é uma constante
E(X)= Var(X) =
( ) 0,1,2,...!
x
P X x e xx
Exercícios1. Considere que o número de mails que chegam a um servidor de
mails no intervalo t segundos é distribuído como Poisson com parâmetro 0.3t. Calcule a seguintes probabilidades:
– Exatamente três mensagens chegarão num intervalo de 10 seg.
– No máximo 20 msgs chegarão num período de 20 seg.– O número de msgs num intervalo de 5 seg está entre 3 e 7
mails.
2. A probabilidade de um query falhar (não ser bem sucedido) é 10(-4). Qual a probabilidade de falharem mais de 3 queries numa sequência de 1000 queries?
Solução
1)
2) P(X10 = 3) = 0.224
3) P(X20 20) = 0.973
4)
tk
ek
tkXtP 3.0
!
)3.0()(
1909.0!
)5.1()73( )5.1(
7
35
e
kXP
k
k
( ) 0,1, 2,...!
x
P X x e xx
k!)(
0
k
x
k
t texF
Solução
• 2)ii
ierrosP
100044
1000
4
)101()10(1000
)3(#
61000443
0
10*825.3)101()10(1000
1)3(#
ii
ierrosP
p xn
xp px n x( ) ( )
1
Distribuições de Variáveis Aleatórias Contínuas
• Normal• Exponencial• Weibull• Lognormal• Pareto• ....
Distribuições de Variáveis Aleatórias Contínuas
• Variáveis aleatórias contínuas– Assumem um intervalo infinito de diferentes valores– W=% percentual de crescimento do PIB em 2005– V=tempo para retornar a resposta de um “query”– Valores específicos-particulares de uma v.a. contínua tem
probabilidade 0– Intervalos de valores tem probabilidade 0
Distribuição Normal (Gaussiana)
• Distribuição mais comum na análise de dados• fdp é:
• -x +• Média é , desvio padrão
f x ex
( )( )
1
2
2
22
Distribuição Normal
• “Em forma de Sino”• Unimodal• Simétrica• Média, mediana e
moda são iguais• Assintótica em relação ao Eixo X• Amplitude Interquartil
é 1,33 s
Média,
Mediana Moda
X
f(X)
50%
Q1 Q3
Notação para Distribuições Gaussianas
• Geralmente denotada N(,)• Normal unitária é N(0,1)• Se x tem N(,), tem N(0,1)
• O -quantil de uma normal unitária z ~ N(0,1) é denotado por z tal que
x
Px
z P x z( ) ( )
Normal
• Função de densidade para =0, =1
0
0.05
0.1
0.15
0.2
0.25
0.3
0.35
0.4
0.45
-5 -4 -3 -2 -1 -6E-14 1 2 3 4 5
x
f(x)
Normal
• Função de densidade para =1
0
0.05
0.1
0.15
0.2
0.25
0.3
0.35
0.4
0.45
-5 -4 -3 -2 -1 0 1 2 3 4 5 6 7
=2
=5
Normal
• Funções de densidade para =1
=1
0
0.05
0.1
0.15
0.2
0.25
0.3
0.35
0.4
0.45
-5 -4 -3 -2 -1 0 1 2 3 4 5 6 7
=2
Distribuição Exponencial• Quantidade de tempo até que determinado
evento ocorra
= taxa de chegadas 1/ = tempo médio entre chegadas
0for x 1
0for x -
λx X
λxX
exF
exf
Exemplo: v.a. exponencial• fdp:• FDC:
• V.A. muito frequentemente usada em computação• Modelos:
– Tempo entre duas submissões de queries a uma maquina de busca
– Tempo de execução de processos – Tempo entre chegadas de pacotes em um roteador
– Tempo entre chegadas de sessões em um servidor
0,)( xexf xxexF 1)(
fdp
x
f(x)
44
Distribuição de Probabilidades Exponencial
T: valores da variável aleatória contínua = intervalo entre chegadas, com e = 2,71828
P(intervalo entre chegadas < t)= 1- e-t
: taxa média de chegadas
1/ : intervalo médio entre chegadas
Distribuição de Probabilidades Exponencial
Exemplos: – Carros chegando num pedágio; – Clientes chegando num caixa eletrônico– Tempo entre duas submissões de queries a
uma maquina de busca– Tempo de execução de processos – Tempo entre chegadas de pacotes em um
roteador
– Tempo entre chegadas de sessões em um servidor
46
Distribuição de Probabilidades Exponencial
• Usada para estudos de Sistemas de Filas• Função densidade de probabilidade
• Parâmetros
1 x
f x e
1 1
47
Distribuição de Probabilidades Exponencial
Valores of X
f(x) Lambda = 3,0 (Média = 0,333)
Lambda = 2,0 (Média = 0,5)
Lambda = 1,0 (Média = 1,0)
Lambda = 0,50 (Média = 2,0)
48
Exemplo
Ex.: Operários chegam no almoxarifado a uma taxa de 30/h. Qual é a probabilidade do intervalo entre chegadas consecutivas de Operários ser maior que 5’ ?
l = 30 e intervalo = 5/60 = 0,0833 horas
P(intervalo entre chegadas > t) =
1 – P(intervalo entre chegadas t) =
1 – (1 – e-30.0,0833) = 0,0821
Distribuição log normal
00
02
1),;(
)2( 2
2)ln(
x
xexxf
x
Muito utilizada para modelar duração de sessão de usuários em serviços web
Média e Variância
A média e variância de uma va X que tem uma distribuição lognormal são:
2 2 2/ 2 2( ) ( ) 1E X e V X e e