Upload
sara-canario-domingues
View
219
Download
2
Embed Size (px)
Citation preview
A Lei dos Grandes Números
Por Thiago de Oliveira Alves (ToWo) – Rio das Flores – 18/01/2013
Introdução: a desigualdade de Tchebycheff
• Quando conhecemos a distribuição de probabilidades de uma variável aleatória X ( quer no caso contínuo ou discreto), podemos calcular E(X) e Var(X), se existirem.
• Já a recíproca não é verdadeira. Ou seja, do conhecimento de E(X) e Var(X) não é possível reconstruir a distribuição de probabilidades de X.
• Porém, mesmo não podendo calcular estas probabilidades ( a partir do conhecimento de E(X) e Var(X)), pode-se provar que existe um limite superior (ou inferior) para elas.
• Isto será expresso na chamada “desigualdade de Tchebycheff”.
Apresentação simples da desigualdade de Tchebycheff
• Seja f(x) a função densidade de probabilidade (fdp) de da variável aleatória X.
• Pela definição de probabilidade sabemos que
• Qualquer outra probabilidade, como
• De , temos que
1)()(
dxxfXP
1)()( dxxfcXP
cX
12
222
cXcX
• Daí, se efetuarmos o produto
• podemos modificar a primeira desigualdade para
• O segundo membro desta desigualdade expressa uma “esperança”. A saber
1)(2
2
dxxfcX
dxxfcXcXP )()( 2
2
222
22
2 1)(1)( cXEdxxfcXdxxfcX
• Esta é a desigualdade de Tchebycheff
• E sua forma complementar é
• Cabe ressaltar que c é um número real qualquer, ԑ é qualquer número positivo e E(X-c)2 é finita.
• Para o caso discreto, com p(xi) sendo a função de probabilidade de X=xi , o processo é análogo. Basta substituir a integral pelo somatório.
22
1)( cXEcXP
22
11)( cXEcXP
1i
• Agora, para ficar mais interessante e prático, vamos ilustrar este resultado fazendo algumas considerações.
• Considere E(X)=μ (média da população), ε=k.σ (um múltiplo do desvio padrão da população) e Var(X)=σ2 (quadrado do desvio padrão).
• Podemos utilizar a desigualdade de Tchebycheff para mostrar que existem limites para uma probabilidade, sem ser necessário conhecer a fdp da variável aleatória.
• Façamos o seguinte
• Isto significa que a probabilidade da variável aleatória X assumir um valor que distancie da média μ, k vezes o desvio padrão, tanto pra mais quanto pra menos, é no máximo 1/k2!
2
22
222
1)(
1
kkXP
XVarXE
XEk
kXP
Exemplo• Houve um concurso público e nele participaram
2000 candidatos.• A prova era de múltipla escolha e tinha 50
questões.• Sabe-se por experiências anteriores que a média
das notas é próxima de 25 e que o desvio padrão é sempre próximo de 6,0.
• Podemos estimar usando a desigualdade de Tchebycheff que a probabilidade de alguém tirar uma nota acima de 37=(25+2x6,0) ou abaixo de 13=(25-2x6,0) é no máximo 0,25=(1/22).
• Surge então uma pergunta.• Quando digo que a probabilidade de alguém tirar
certa nota numa prova é 0,25, quer dizer que 25% dos candidatos obterão este resultado?
• A resposta depende de um fator: o número de candidatos. Quanto maior o número de candidatos, mais provável que a frequência relativa de pessoas que tiraram uma nota seja igual a probabilidade deste evento.
• Matematicamente falando, podemos dizer que a frequência relativa será igual a probabilidade se o número de candidatos for infinito.
• Este resultado é expresso na Lei dos Grandes Números.
Lei dos Grandes Números
• Esta lei possui várias formulações, mas enunciaremos aqui a formulação de Bernouilli.
• Seja E um experimento e A um evento associado a E.
• Considere n repetições independentes de E, • seja nA o número de vezes em que A ocorra nas n
repetições,• e façamos fA = nA/ n.• Seja P(A)=p para todas as repetições de E.
• Dado as condições anteriores, para todo ԑ>0
• Ou, equivalente,
2
1
npppfP A
2
11
npppfP A
• Podemos demonstrar esta lei usando a desigualdade de Tchebycheff que nos foi apresentada anteriormente.
• nA é uma variável aleatória binomialmente distribuída. O evento A é uma dicotomia. Pode ocorrer ou não.
• fA também é uma variável aleatória e aplicaremos a desigualdade de Tchebycheff a ela.
nppnVar
nfVar
pnEn
fE
nnf
pnpnVarnpnE
AA
AA
AA
A
A
11
1
1
2
npppfP
npp
k
npp
knppk
knppkpfP
A
A
2
22
2
11
11
1111
111
• Fazendo n tender ao infinito, chegaremos ao limite que pretendíamos demonstrar.
• Ou seja, quando o número n de repetições de um experimento for muito grande a frequência relativa de sucessos fA convergirá em probabilidade para o valor teórico da probabilidade de sucesso p.
0,1lim
111lim 2
pfPnpp
An
n
Exemplo
• Quantos candidatos serão necessários para que tenhamos no mínimo 95% de certeza de que a proporção de pessoas que tiraram a nota 37 difira 0,01 da probabilidade teórica máxima 0,25?
• A resposta é 37500 candidatos.
3750005,0
1875
05,00001,0
75,025,095,001,0
25,0125,01
95,011
25,001,0
11
2
2
2
n
nn
npp
p
npppfP A
Agora um exemplo para fazer em casa.
• Ao jogar uma moeda para o alto você tem 0,5 de probabilidade teórica de tirar coroa.
• Quantas vezes você jogaria uma moeda para ter ao menos 99% de certeza de que a proporção de coroas entre as jogadas seja no máximo 50,1%?
• Confira a resposta no próximo slide.
25000001,0
2500
01,00001,025,001,0
01,05,015,0
01,0199,011
01,0501,05,0
2
22
n
nn
npp
npp
pffp
A
A
• Cabe lembrar que fA é uma variável aleatória e se jogarmos a moeda 250000 vezes ela estará ou não a menos de 0,01 de 1/2.
• O que o exemplo anterior garante é que eu tenho no mínimo 99% de chance de ter este resultado ao jogar a moeda 250000 vezes.
• Isto, é. A cada ocasião que eu jogar a moeda 250000 vezes, cerca de 99% destas ocasiões terá a frequência relativa de sucessos diferenciando 0,01 da probabilidade teórica.
Conclusão• Sabemos agora de maneira segura que podemos inferir a
probabilidade de um evento ocorrer pela frequência com que ele ocorre e vice-versa.
• Esta lei também é uma ótima ferramenta no processo de decisão e análise de risco. Ao decidirmos pelo mais provável estaremos garantidos de que em longo prazo erraremos menos.
• O mesmo seria que se escolhêssemos a opção que ocorreu com mais frequência após um longo prazo, estaríamos escolhendo a opção mais provável.
• Vale a pena tentar. O problema é que, como foi visto, o prazo pode ser muito longo para se ter uma boa garantia como 95% ou 99% de certeza, por exemplo.
Bibliografia• MEYER, Paul L. Probabilidade: aplicações à estatística; tradução do
Prof. Ruy de C. B. Lourenço Filho. 2 ed. Rio de Janeiro: LTC – Livros Técnicos e Científicos S.A., 1983.
• HELENE, Otaviano Augusto Marcondes, VANIN, Vito R. Tratamento estatístico de dados em física experimental. 2 ed. São Paulo: Edgar Blucher, 1991.
• MAE 228 - Notas de aula. Desigualdades de Markov e Chebyshev e Lei Fraca dos Grandes Números. Notas transcritas por: Rafael Keiti Oiski Grunho de Souza ([email protected]) e Paulo Laurent Waelkens ([email protected]). IME – USP, 31 de Março de 2006
• MURTEIRA, Bento José Ferreira (1990): Probabilidades e Estatística - Volume I, 2ª Edição Revista, Editora McGraw-Hill de Portugal, Lda..
• MAGALHÃES, Marcos N. Probabilidade e variáveis aleatórias. 2 ed. São Paulo: Edusp, 2006.
• JAMES, Barry. Probabilidade: um curso em nível intermediário. 3 ed. Rio de Janeiro: IMPA, 2006.
Para críticas, sugestões e correções envie um e-mail para:
• [email protected] (Thiago de Oliveira Alves).