Sartoris - Estatística e Introdução à Econometria

Embed Size (px)

Citation preview

  • 8/12/2019 Sartoris - Estatstica e Introduo Econometria

    1/332

  • 8/12/2019 Sartoris - Estatstica e Introduo Econometria

    2/332

  • 8/12/2019 Sartoris - Estatstica e Introduo Econometria

    3/332

    1

    CAPTULO 1 PROBABILIDADE

    1.1 ConceitoO conceito de probabilidade est sempre presente em nosso dia a dia: qual a probabilidade

    de que o meu time seja campeo? Qual a probabilidade de que eu passe naquela disciplina? Qual a probabilidade de que eu ganhe na loteria?

    Probabilidade uma espcie de medida associada a um evento. No caso especfico da primeira pergunta do pargrafo anterior o evento em questo meu time ser campeo. Se esteevento impossvel de ocorrer, dizemos que a sua probabilidade zero. Se, entretanto, ele ocorrercom certeza, a sua probabilidade igual aum (ou cem por cento).

    Chamando este evento simplesmente de A, ento dizemos que:

    Se A impossvel de ocorrer, ento P(A) = 0.Se A ocorre com certeza, ento P(A) = 1.

    Onde a expresso P(A) lida como probabilidade de A ocorrer, ou simplesmenteprobabilidade de A.

    A probabilidade de um evento A qualquer pode ser definida, de uma maneira simplificada1 como:

    P(A) =ocorremeventosostodosqueemvezesdenmero

    ocorreAqueemvezesdenmero

    Esta definio desse ser vista com ressalvas: no se trata do nmero de vezes que de fatoocorreriam em um experimento, mas sua proporo terica. Assim, se jogssemos uma moedacomum trs vezes e nas trs ela desse cara, isto no significa que a probabilidade de dar cara igual a 1, o que nos levaria a concluir quecom certeza esta moeda dar cara sempre, o que umabsurdo.

    O conjunto de todos os eventos possveis deste experimento (conjunto este que chamamosde espao amostral) composto de dois possveis resultados: cara ou coroa. Considerando queestes dois eventos tm a mesma chance de ocorrer (o que vale dizer que a moeda no est viciada),teremos:

    P(cara) =ocorremeventosostodosqueemvezesdenmero

    cara""ocorre queemvezesdenmero =21 = 0,5

    Todos os eventos, neste caso, so dois: cara ou coroa. Destes dois, um deles oevento em questo (cara). Portanto a probabilidade de dar cara igual a 0,5 (ou 50%).

    E, de maneira idntica, temos para o evento coroa:

    P(coroa) =ocorremeventosostodosqueemvezesdenmero

    coroa""ocorre queemvezesdenmero =21 = 0,5

    1 No apndice 1.B deste captulo dada uma definio formal de probabilidade.

  • 8/12/2019 Sartoris - Estatstica e Introduo Econometria

    4/332

    2

    Repare que a soma das duas probabilidades igual a 1. E tinha que ser mesmo. A soma das probabilidades (neste caso especfico) representa a probabilidade do evento dar cara ou coroa, ougeneralizando ocorrer qualquer evento possvel, que algo que ocorrer com certeza.

    Se mudarmos o jogo, de cara ou coroa para dados, se jogarmos o dado uma nica vez, temosseis possibilidades, que correspondem aos nmeros inteiros de 1 a 6. A probabilidade de cair umnmero qualquer (digamos, o 3) ser dada por:

    P(cair 3) =ocorremeventosostodosqueemvezesdenmero

    "3"ocorre queemvezesdenmero =61

    Uma outra maneira de encontrarmos estas probabilidades seria se fizssemos umexperimento (por exemplo, jogar a moeda) um nmero muito grande de vezes (na verdade,deveriam ser infinitas vezes) e encontrssemos a proporo entre caras e coroas. Este experimentofoi feito2 e os resultados so mostrados na tabela abaixo:

    no de jogadas no de caras no de coroas proporo de caras proporo de coroas

    10 6 4 0,6000 0,4000100 47 53 0,4700 0,53001000 509 401 0,5090 0,401010000 4957 5043 0,4957 0,504325000 12486 12514 0,4994 0,5006

    O experimento evidencia que, medida que o nmero de jogadas aumenta, a proporo decaras e de coroas se aproxima do valor 0,5.

    Chamando de n o nmero de vezes que o experimento feito, uma maneira de definir probabilidade :

    P(A) = limn nocorreAqueemvezesdenmero

    Que chamada de definio de probabilidade pelafreqncia relativa ou ainda, definiofreqentista de probabilidade.

    Exemplo 1.1.1Qual a probabilidade de, jogando um nico carto, acertar a sena (seis dezenas em um total de 60)?

    O acerto exato das seis dezenas uma nica possibilidade entre todas as combinaes possveis (combinaes mesmo3, j que a ordem em que os nmeros so sorteados no relevante):

    P(ganhar na sena) =60,6C1 =

    !6!54!60

    1

    =860.063.50

    1 0,00000002

    2 Na verdade a moeda no foi realmente jogada 25000 vezes, mas os resultados foram obtidos atravs de uma simulao por computador.3 Para uma reviso de anlise combinatria veja o apndice 1.A.

  • 8/12/2019 Sartoris - Estatstica e Introduo Econometria

    5/332

    3Portanto, a probabilidade de acertar a sena com apenas um carto de uma para cada 50.063.860 ouaproximadamente 0,000002%.

    Exemplo 1.1.2Sendo o conjunto X definido por X = {x | 0 < x < 2}, qual a probabilidade de, ao sortearmos umnmero qualquer deste conjunto este nmero pertena ao intervalo [0,5; 1,5]? E qual a probabilidade deste nmero ser exatamente igual a 1?

    O conjunto X um conjuntocontnuo, j que contmtodos os nmeros reais que sejammaiores do que 0 e menores do que 2. Tem, por exemplo, o nmero 1; o nmero 0,5; o nmero 0,4;mas tambm tem o 0,45; o 0,475; o 0,46. Dados dois elementos deste conjunto,sempre possvelencontrar um nmero que esteja entre estes dois. No h saltos ou buracos, da a idia decontinuidade. Ao contrrio do dado em que os valores possveis so 1, 2, 3, 4, 5 e 6 (no existe 1,5ou 2,1), que um conjuntodiscreto4.

    Neste caso, a probabilidade de sortearmos qualquer nmero entre 0,5 e 1,5 (inclusive), que um intervalo de comprimento igual a 1 (= 1,5 0,5), de um intervalo possvel que tem comprimentoigual a 2 (= 2 0) ser dada por:

    P(0,5 x 1,5) =21

    E a probabilidade de ser exatamente 1? Ou seja, de sortear um nico nmero entre um totalde nmeros presente no conjunto X de...infinitos! A probabilidade ser dada, ento por:

    P(x = 1) = limnn1 = 0

    Portanto, embora seja possvel de ocorrer, a probabilidade de ser igual a 1 (ou igual aqualquer nmero) igual azero, se estivermos falando de um conjunto contnuo. A probabilidades ser diferente de zero se estivermos falando de umintervalo contido neste conjunto.

    Como conseqncia disso, no far diferena se o intervalo para o qual encontramosinicialmente a probabilidade (entre 0,5 e 1,5) fosse fechado ou aberto (isto , inclusse ou no osextremos), pois a probabilidade de ser exatamente 0,5 ou 1,5 zero. Portanto, como X umconjunto contnuo:

    P(0,5 x 1,5) = P(0,5 < x < 1,5) =21

    1.2 Probabilidade subjetiva

    Nos casos exemplificados acima, assumindo que os dados e as moedas utilizadas no sejamviciados, as probabilidades calculadas so exatas. Nem sempre isto possvel.

    Imagine o evento meu time ser campeo. No possvel repetir este experimento (ocampeonato) um nmero muito grande de vezes. Na verdade, este campeonato, com estes times,com os mesmos jogadores nas mesmas condies s jogado uma nica vez. Entretanto, possvelatribuir um valor que represente as chances do time ganhar o campeonato mas, evidentemente, este

    4 No h necessidade de que um conjunto discreto seja composto apenas por nmeros inteiros, entretanto. Uma provacom 20 questes de mltipla escolha, cada uma delas valendo meio ponto ter notas variando neste intervalo, isto , poder haver nota 7,0 ou 7,5, mas nunca 7,2 ou 7,3. um conjunto discreto, portanto.

  • 8/12/2019 Sartoris - Estatstica e Introduo Econometria

    6/332

    4valor ser diferente para cada pessoa que opinar a respeito: um torcedor fantico tender atribuir umvalor maior do que um analista frio e imparcial (se que isto existe).

    Qualquer que seja este valor, entretanto, deve seguir as mesmas regras que a probabilidadeobjetiva, isto , tem que estar entre 0 e 1, sendo 0 correspondendo impossibilidade e 1 certeza deque o time ser campeo.

    E assim vale para uma srie de situaes: a probabilidade de que o governo mude a polticaeconmica ( certamente maior em perodos de crise); a probabilidade de chover ou no ( maior oumenor quando a previso do tempo afirma que vai chover?); a probabilidade de ser assaltadoquando se passa por determinada rua, etc.

    Exemplo 1.2.1Qual a probabilidade de se acertar os treze pontos na loteria esportiva?

    A mais complicado porque depende da avaliao subjetiva que se faz dos times em cadaum dos jogos. de se imaginar que um teste da loteria esportiva em que predominem jogosequilibrados ser mais difcil de acertar e tender a ter menos acertadores do que um teste que tenhamais barbadas.

    Por exemplo, Flamengo x Olaria (um jogo teoricamente fcil):P(Flamengo) = 70%P(empate) = 20%P(Olaria) = 10%

    J Corinthians x So Paulo (jogo equilibrado):P(Corinthians) = 30%P(empate) = 40%P(So Paulo) = 30%

    Todos estes nmeros, evidentemente, sujeitos discusso. Esta avaliao teria que ser feita jogo a jogo para se computar a probabilidade de ganhar na loteria esportiva.

    1.3 Probabilidade do e e do ou

    No incio do captulo chamamos de espao amostral oconjunto de todos os eventos possveis. O uso do termo conjunto, no foi por acaso. De fato, h uma associao muito grandeentre a teoria dos conjuntos (e a sua linguagem) e a de probabilidade.

    Chamando de S o espao amostral (que equivale a todos os eventos, portanto P(S)=1) esendo A um evento deste espao amostral (isto , A um subconjunto de S), uma representaogrfica da probabilidade de A mostrada na figura abaixo:

  • 8/12/2019 Sartoris - Estatstica e Introduo Econometria

    7/332

    5

    Em que a regio em que o conjunto A est representado representa a sua probabilidade emrelao ao espao amostral S. Esta representao grfica de probabilidade conhecida comoDiagrama de Venn.

    Um caso particular importante um evento que no est em S (impossvel de ocorrer), como

    o dado cair no nmero 7 ou a moeda no dar nem cara, nem coroa, representado pelo conjunto vazio(), em que, evidentemente5 P() = 0.

    Pelo diagrama de Venn podemos verificar uma relao importante: a probabilidade de no-A, ou seja, o complementar de A, representado6 por A . O conjunto A representado por todos os pontos que pertencem a S, mas no pertencem a A, o que no Diagrama de Venn abaixo representado pela regio sombreada:

    A probabilidade de A ser dada ento por:

    P(A ) = P(S) P(A)

    Mas como P(S) = 1, ento:

    P(A) = 1 P(A)

    Ou:

    5 A recprocano verdadeira. Pelo exemplo 1.1.2, vimos que P(A) pode ser igual a zero mesmo que A no seja umconjunto vazio. No exemplo P(x=1) = 0 no porque x no pudesse ser igual a 1, mas por fazer parte de um conjuntocontnuo.6 H quem prefira a notao AC.

  • 8/12/2019 Sartoris - Estatstica e Introduo Econometria

    8/332

    6

    P(A) + P(A ) = 1

    Isto , a soma da probabilidade de um evento com a do seu complementar sempre igual a1.

    Suponhamos agora dois eventos quaisquer de S, A e B. A representao no Diagrama deVenn ser:

    Dados dois eventos poderemos ter a probabilidade de ocorrerA e B, isto , ocorrer A etambm B. Por exemplo, jogar dois dados e dar 6 no primeiro e 1 no segundo; ser aprovado emEstatstica e em Clculo. Em linguagem de conjuntos, a ocorrncia de um evento e tambm outro representada pelainterseco dos dois conjuntos (AB). No Diagrama de Venn representada pela rea sombreada abaixo:

    P(A e B) = P(AB)

    H ainda a probabilidade de ocorrncia de Aou B. Isto equivale a ocorrer A, ou B, ouambos7. Em linguagem de conjuntos equivale aunio de A e B (AB), representada abaixo:

    7 No confundir com o chamado ou exclusivo, em que ocorre A, ocorre B, mas no ambos.

  • 8/12/2019 Sartoris - Estatstica e Introduo Econometria

    9/332

    7

    P(A ou B) = P(AB)

    Podemos verificar que, se somarmos as probabilidades de A e B, a regio comum a ambos (ainterseco) ser somada duas vezes. Para retirarmos este efeito, basta subtrairmos a interseco(uma vez). Portanto:

    P(A ou B) = P(AB) = P(A) + P(B) P(AB)

    Um caso particular desta regra aquele em que A e B jamais ocorrem juntos, so eventosditos mutuamente exclusivos(ocorrer um implica em no ocorrer outro).Os conjuntos no tero pontos em comum, portanto (a interseco o conjunto vazio) e A e B ento so ditosdisjuntos,como mostrado abaixo:

    Neste caso, no h dvida:

    P(A ou B) = P(AB) = P(A) + P(B)

    Portanto, a chamada regra do ou pode ser resumida assim:

    Se A e B so eventos quaisquer:P(AB) = P(A) + P(B) P(AB)

    Se A e B so eventosmutuamente exclusivos(disjuntos):P(AB) = P(A) + P(B)

  • 8/12/2019 Sartoris - Estatstica e Introduo Econometria

    10/332

    8 Exemplo 1.3.1Qual a probabilidade de, ao jogar um dado, obter-se um nmero maior que 4?

    Nmero maior do que 4 no dado temos o 5 e o 6, portanto:

    P(maior que 4) = P(5 ou 6)

    Que so eventos disjuntos, j que, se der 5, impossvel dar 6 e vice-versa.

    P(5 ou 6) = P(5) + P(6) =61 +

    61 =

    31

    Exemplo 1.3.2(desespero dos pais de gmeos) Duas crianas gmeas tm o seguinte comportamento: uma delas (a mais chorona) chora 65% dodia; a outra chora 45% do dia e ambas choram,ao mesmo tempo, 30% do dia. Qual a probabilidade(qual o percentual do dia) de que pelo menos uma chore? E qual a probabilidade de que nenhumachore?

    A probabilidade de que pelo menos uma chore a probabilidade de que a primeira choreoua segunda chore. Chamando de C1 o evento a primeira criana chora e C2 a segunda crianachora, temos:

    P (C1 ou C2) = P(C1) + P(C2) P(C1 e C2) = 0,65 + 0,45 0,3 = 0,8

    Portanto, pelo menos uma criana estar chorando 80% do tempo. Nenhuma das crianaschora o evento complementar:

    P(nenhuma chora) = 1 P(C1 ou C2) = 1 0,8 = 0,2

    Assim sendo, os pais destas crianas tero paz em apenas 20% do tempo.1.4 Probabilidade Condicional

    Qual a probabilidade de que o Banco Central aumente a taxa de juros? Qual a probabilidadede que ele aumente a taxa sabendo-se que ocorreu uma crise que pode ter impacto sobre a inflao?

    Qual a probabilidade do seu time ganhar o prximo jogo? E se j sabido que o adversrio jogar desfalcado de seu principal jogador?

    Qual a probabilidade de, jogando dois dados em seqncia, obter-se um total superior a 7? Ese, na primeira jogada, j se tirou um 6?

    Voc acorda de manh e o cu est azul e sem nuvens. Voc pega o guarda-chuva ou no? claro que, de posse dessa informao, a probabilidade estimada para o evento chover diminui.

    E assim vale para os trs exemplos anteriores. O acontecimento de um evento afeta a probabilidade de ocorrncia do outro.

    Um casal que tem trs filhos homens vai para o quarto filho. Qual a probabilidade de ser(afinal!) uma menina? Infelizmente para o casal, no diferente daquela que seria caso fosse o primeiro. No faamos confuso: claro que, para um casal quevai ter quatro filhos, a

  • 8/12/2019 Sartoris - Estatstica e Introduo Econometria

    11/332

    9 probabilidade de serem quatro meninas pequena. Mas se ele j teve trs meninas, isto no afeta a probabilidade do prximo filho ser menino ou menina (afinal, os pobres espermatozides no tm amenor idia do histrico familiar).

    A pergunta que se faz, seja em um caso ou em outro : qual a probabilidade de um eventosabendo-se que um outro evento j ocorreu (ou vai ocorrer)? Qual probabilidade de A dado que B j um fato da vida.

    No Diagrama de Venn acima, B j ocorreu! A probabilidade de A ocorrer ento s pode sernaquele pedao em que A e B tm em comum (a interseco). Mas a probabilidade deve sercalculada no mais em relao a S, mas em relao a B, j que os pontos fora de B sabidamente no podem acontecer (j que B ocorreu). Portanto, a probabilidade de A tendo em vista que B ocorreu(ou ocorrer), representada por P(A|B) (l-se probabilidade de A dado B), ser dada por:

    P(A|B) =P(B)

    P(AeB) (1.4.1)

    A regra do e, j apresentada na seo anterior, ganha uma nova forma:

    P(A e B) = P(A|B)P(B) ouP(A e B) = P(B|A)PA)

    Se o evento B no tiver qualquer efeito sobre a probabilidade do evento A, ento teremos:

    P(A|B) = P(A) eP(B|A) = P(B)

    E A e B so ditos eventosindependentes (a probabilidade condicional igual nocondicional).

    Sero eventosdependentesem caso contrrio, isto :P(A|B) P(A) eP(B|A) P(B)

    Ento, seA e B forem eventos independentes, vale:

    P(A e B) = P(A)P(B)

  • 8/12/2019 Sartoris - Estatstica e Introduo Econometria

    12/332

    10

    No confunda: o fato de dois eventos serem independentes no quer dizer que eles sejammutuamente exclusivos. Pelo contrrio: se dois eventos (no vazios) so mutuamente exclusivos(disjuntos) eles so,necessariamente, dependentes, j que a ocorrncia de um implica a noocorrncia de outro.

    Resumindo: para dois eventosindependentes temos:

    P(A e B) = P(A)P(B)P(A ou B) = P(A) + P(B) - P(A)P(B)

    Para dois eventosdisjuntos (mutuamente exclusivos):

    P(A e B) = 0P(A ou B) = P(A) + P(B)

    Para dois eventos quaisquer:

    P(A e B) = P(A)P(B|A) = P(B)P(A|B)P(A ou B) = P(A) + P(B) P(A e B)

    Exemplo 1.4.1Qual a probabilidade de que, jogando dois dados em seqncia, obtenhamosexatamente 7? E sena primeira jogada j obtivemos um 6?

    Para obtermos um total de 7 temos os seguintes resultados possveis: 1 e 6, 2 e 5, 3 e 4, 4 e3, 5 e 2, 6 e 1. O resultado de cada dado independente do resultado do outro, de modo que:

    P(1 e 6) = P(2 e 5) = P(3 e 4) = P(4 e 3) = P(5 e 2) = P(6 e 1) =61

    61 =

    361

    A probabilidade de que ocorra qualquer um desses resultados, tendo em vista que eles somutuamente exclusivos :

    P[(1 e 6) ou (2 e 5) ou (3 e 4) ou (4 e 3) ou (5 e 2) ou (6 e 1)] =361 +

    361 +

    361 +

    361 +

    361 +

    361 =

    61

    Se j deu 6 no primeiro dado o nico resultado possvel para somar 7 que d 1 no segundo

    dado. A probabilidade 61 , portanto. De fato, usando a definio 3.4.1:

    P(soma=7|1odado=6) = 6)dadoP(1o 6)dado1oe7P(soma = == = 6)dadoP(1o 6)dado1oe1dadoP(2o = == =

    6136

    1

    = 61

    Note que:

    P(soma=7|1odado=6) = P(soma=7)

  • 8/12/2019 Sartoris - Estatstica e Introduo Econometria

    13/332

    11 Portanto os eventos a soma darexatamente 7 e o resultado8 do 1o dado so independentes.

    Exemplo 1.4.2 No exemplo 1.3.2 os eventos so independentes? Caso no sejam, qual a probabilidade de que a primeira criana choredado que a segunda chora? E qual a probabilidade de que a segunda crianachoredado que a primeira chora?

    Os eventos C1 e C2no so independentes(so dependentes) dado que:P(C1)P(C2) = 0,650,45 = 0, 2925 diferente de:P(C1 e C2) = 0,3

    Para calcularmos as probabilidades condicionais, temos:P(C1 e C2) = P(C1) P(C2|C1)

    0,3 = 0,65 P(C2|C1)P(C2|C1) =

    65,03,0 0,4615

    P(C1 e C2) = P(C2) P(C1|C2)

    0,3 = 0,45 P(C1|C2)P(C1|C2) =

    65,045,0 0,6923

    Portanto, se a primeira criana chorar, h uma probabilidade de 46,15% de que a segundacriana chore e, se a segunda criana chorar, a probabilidade que a primeira chore de 69,23%.Como as probabilidades incondicionais eram de 45% e 65%, respectivamente, percebe-se que o fatode uma criana chorar aumenta a chance da outra chorar tambm.

    Exemplo 1.4.3Atravs do Diagrama de Venn abaixo (onde os valores marcados correspondem s probabilidadesdas reas delimitadas), verifique que, apesar de que P(ABC) = P(A)P(B)P(C), A e B e Cnoso eventos independentes.

    Do diagrama, temos:

    8 Verifique que a concluso vlida para qualquer resultado no 1o dado.

  • 8/12/2019 Sartoris - Estatstica e Introduo Econometria

    14/332

    12 P(A) = 0,1 + 0,15 + 0,1 + 0,05 = 0,4P(B) = 0,25 + 0,05 + 0,1 + 0,1 = 0,5P(C) = 0,15 + 0,15 + 0,1 +0,1 = 0,5

    P(AB) = 0,1 + 0,05 = 0,15P(AC) = 0,1 + 0,15 = 0,25P(BC) = 0,1 + 0,1 = 0,2

    P(ABC) = 0,1

    De fato, P(ABC) = P(A)P(B)P(C), mas:

    P(AB) P(A)P(B)P(BC) P(B)P(C)P(AC) P(A)P(C)

    Portanto, A, B e C so dependentes.

    Exemplo 1.4.4 Foi feita uma pesquisa com 100 pessoas sobre as preferncias a respeito de programas na televiso.Os resultados obtidos foram os seguintes:

    homens mulheres totalfutebol 40 20 60novela 5 35 40total 45 55 100Entre o grupo de entrevistados, qual a probabilidade de preferir novela? E futebol?

    P(novela) =10040 = 0,4 = 40%

    P(futebol) =10060

    = 0,6 = 60%Qual a probabilidade de ser mulher e preferir futebol?

    P(mulher e futebol) =10020 = 0,2 = 20%

    Qual a probabilidade de, em sendo homem, preferir futebol?Podemos resolver diretamente j que, pela tabela, dos 45 homens, 40 preferem futebol:

    P(futebol | homem) =4540 = 0,888... 88,8%

    Ou pela definio de probabilidade condicional:

    P(futebol | homem) = P(homem)futebol)eP(homem

    =10045100

    40

    = 0,888... 88,8%

    Qual a probabilidade de que, se preferir novela, for mulher?De novo possvel resolver diretamente pela tabela, tendo em vista que, dos 40 que

    preferem novela, 35 so mulheres:

    P(mulher | novela) =4035 = 0,875 = 87,5%

    Ou pela definio de probabilidade condicional:

  • 8/12/2019 Sartoris - Estatstica e Introduo Econometria

    15/332

    13

    P(mulher | novela) =P(novela)

    novela)eP(mulher =

    10040

    10035

    = 0,875 = 87,5%

    Note que a preferncia por um tipo de programa ou outro e o sexo no so eventosindependentes, j que:

    P(mulher | novela) P(mulher)P(futebol | homem) P(futebol)

    1.5 Regra de Bayes

    Exenplo 1.5.1Suponha que, numa eleio para governador em um estado norte americano, temos um candidatodemocrata e um republicano. Entre os eleitores brancos, 30% votam no democrata, esta proporosobe para 60% entre os eleitores negros e de 50% entre os eleitores de outras etnias. Sabendo-seque h 70% de eleitores brancos, 20% de negros e 10% de outras etnias, se um voto democrata retirado ao acaso, qual a probabilidade de que ele tenha sido dado por um eleitor negro?

    Utilizaremos as seguintes abreviaes:B- branco D- democrata N- negro R- republicanoO- outras etnias

    Pelo enunciado sabemos que:P(B) = 0,7P(N) = 0,2P(O) = 0,1P(D|N) = 0,6P(D|B) = 0,3P(D|O) = 0,5

    E pede-se qual probabilidade do voto ser de um eleitor negrodado que o voto para ocandidato democrata, isto :

    P(N|D) = ?

    P(N|D) =P(D)

    D)eP(N

    A probabilidade de ser negro e democrata dada por:P(N e D) = P(N)P(D|N) = 0,20,6 = 0,12

    E a probabilidade de ser democrata ser dada pela soma dos votos brancos e democratas,negros e democratas e outras e democratas:P(D) = P(D e B) + P(D e N) + P(D e O) = 0,70,3 + 0,20,6 + 0,10,5 = 0,38

    Assim sendo:

    P(N|D) =38,012,0 0,3158 = 31,58%

  • 8/12/2019 Sartoris - Estatstica e Introduo Econometria

    16/332

    14 Portanto, 31,58% dos votos democratas so de eleitores negros.

    O exemplo anterior partiu de probabilidades condicionais para calcular uma probabilidadecom a condio invertida. A generalizao do resultado obtido conhecida comoRegra deBayes, que enunciada abaixo:

    Se temos as probabilidades condicionais de um evento B dados todos os eventos do tipo Ai,

    (i = 1, 2,..., n) e queremos encontrar a probabilidade condicional de um certo evento A j dado B, estaser dada por 9:

    P(A j|B) =

    =

    n

    1iii

    j j

    )P(A)A|P(B

    )P(A)A|P(B

    9 Evidentemente esta expresso no precisa ser memorizada se for repetido o raciocnio do exemplo 1.5.1.

  • 8/12/2019 Sartoris - Estatstica e Introduo Econometria

    17/332

    15Exerccios

    1. Em uma caixa h 7 lmpadas, sendo 4 boas e 3 queimadas. Retirando trs lmpadas ao acaso,sem reposio, qual a probabilidade de que:

    a) todas sejam boas. b) todas estejam queimadas.c) exatamente 2 sejam boas.

    d) pelo menos 2 sejam boas.2. Calcule a probabilidade de que, no lanamento de um dado, o nmero que der seja:

    a) mpar b) primoc) no mnimo 4.d) no mximo 5.

    3. Ao lanar dois dados em seqncia, quer-se atingir um total de 11 pontos.a) Qual a probabilidade que isto ocorra? b) Qual a probabilidade que isto ocorra supondo que o primeiro dado deu 4?c) Qual a probabilidade que isto ocorra supondo que o primeiro dado deu 6?d) O evento total de 11 pontos independente do resultado do primeiro dado? Justifique.

    4. Um apostador aposta no lanamento de um dado em um nico nmero. Qual a probabilidade de:a) em trs jogadas, ganhar as trs b) em quatro jogadas, ganhar exatamente as duas primeiras.c) em quatro jogadas, ganhar exatamente duas (quaisquer).d) em quatro jogadas, ganhar pelo menos duas.e) em quatro jogadas, ganhar duas seguidas.

    5. Na primeira loteria de nmeros lanada no pas, o apostador deveria acertar cinco dezenas em umtotal de 100 possveis, apostando para isso em 5, 6, 7, 8, 9 ou 10 dezenas.

    a) Qual a probabilidade de acertar as 5 dezenas em cada uma das situaes? b) Se a aposta em 5 dezenas custasse $ 1,00, qual deveria ser o preo dos demais tipos de

    apostas levando-se em considerao a probabilidade de acerto?

    6. Considerando que, em jogos de futebol, a probabilidade de cada resultado (vitria de um time, deoutro ou empate) igual, qual a probabilidade de fazer os treze pontos na loteria nos seguintescasos:

    a) sem duplos ou triplos. b) com um nico duplo.c) com um nico triplo.d) com dois duplos e trs triplos.

    7. Represente no diagrama de Venn:a) AB b) ABc) ABd) AB

    8. Verifique que a probabilidade do ou exclusivo dada por:P (A ou exclusivo B) = P[(AB)(AB)]

    (Sugesto: utilize o diagrama de Venn)

  • 8/12/2019 Sartoris - Estatstica e Introduo Econometria

    18/332

    16 9. Foram selecionados 200 pronturios de motoristas e o resultado foi o seguinte:

    homens mulheres totalcom multa 65 50 115sem multa 45 40 85Total 110 90 200

    a) Qual a probabilidade de que um motorista deste grupo tenha sido multado? b) Qual a probabilidade de que um motorista (homem) deste grupo tenha sido multado?c) Qual a probabilidade de queuma motorista deste grupo tenha sido multada?d) Qual a probabilidade de que, sendo o motorista homem, ele tenha sido multado?e) Qual a probabilidade de que, sendo mulher, a motorista tenha sido multada?f) Qual a probabilidade de, em sendo multado, o motorista seja homem?g) A probabilidade de ser multado independente do sexo? Justifique.

    10. Perguntou-se para 300 estudantes o que fariam aps a faculdade: procurariam emprego oucursariam ps-graduao (ou ambos). As respostas foram:

    homens mulheres

    Emprego 110 90 ps-grad. 90 80Total 160 140Calcule a probabilidade de um estudante, escolhido ao acaso:

    a) ser homem e procurar emprego. b) ser mulher e continuar estudando.c) ser homem e no continuar estudando.d) ser mulher ou no procurar emprego.e) em sendo homem, querer continuar apenas estudando.f) se quer apenas trabalhar, ser mulher.

    11. Um cubo de madeira pintado e a seguir dividido em 512 cubinhos de mesmo tamanho. Qual

    a probabilidade de que, se pegarmos um destes cubinhos aos acaso, ele:a) tenha apenas uma face pintada. b) tenha duas faces pintadas.c) tenha pelo menos duas faces pintadas.d) tenha trs faces pintadas.

    12. Dado um conjunto X = {x | 0 < x < 8}, onde representa o conjunto dos nmeros naturais.Se escolhermos ao acaso um nmero deste intervalo, calcule as probabilidades pedidas:

    a) P(x = 2) b) P(x > 2)c) P(x < 5)d) P(x = 8)

    13. Dado um conjunto X = {x | 0 < x < 8}, onde representa o conjunto dos nmeros reais. Seescolhermos ao acaso um nmero deste intervalo, calcule as probabilidades pedidas:

    a) P(x = 2) b) P(x > 2)c) P(x < 5)d) P(0 x 8)

  • 8/12/2019 Sartoris - Estatstica e Introduo Econometria

    19/332

    1714. Em um colgio de ensino mdio h 120 alunos no 1o ano, 100 no 2o ano e 80 no 3o ano. Se doisalunos so escolhidos ao acaso e o primeiro est mais adiantado do que o segundo, qual a probabilidade de que ele esteja no 3o ano?

    15. Verifique se so verdadeiras ou falsas as afirmaes abaixo e justifique.a) Sendo S o espao amostral, ento P(S) = 1. b) Se P(A) = 1 ento A = S.

    c) Se P(A) = 0 ento A =.d) Se A e B so mutuamente exclusivos, ento P(AB) = 0e) Se P(AB) = 0, ento A e B so disjuntos.f) Se A e B so independentes, ento P(AB) = P(A) + P(B).g) Se P(AB) = 0, ento A e B so independentes.h) Se P(AB) = 1, ento A = B = S.i) Se P(AB) = 1, ento A = S ou B = S. j) Se A, B e C so independentes, ento P(ABC) = P(A).P(B).P(C).k) Se P(ABC) = P(A).P(B).P(C), ento A, B e C so independentes.l) Se P(A ) = 1 ento A =.m) Se A e B so independentes, ento A e B so independentes.

    16. H 60% de probabilidade que haja desvalorizao cambial. Se a desvalorizao ocorrer, h 70%de chances do governo lanar um pacote emergencial de medidas. Se no ocorrer, as chances deste pacote ser lanado caem para 40%. Se o pacote foi lanado, qual a probabilidade que tenha ocorridodesvalorizao cambial?

    17. Num jogo de domin uma pea com dois valores iguais tirada. Qual a probabilidade de que a pea seguinte se encaixe?

    18. Num jogo de pquer cada jogador tem cinco cartas. Considerando que seja utilizado o baralhocompleto, qual a probabilidade do jogador obter:

    a) um par. b) uma trinca.c) dois pares.d) um par e uma trinca ( full house ).e) uma quadra.f) todas as cartas do mesmo naipe, mas no em seqncia ( flush).g) uma seqncia (por exemplo: 7, 8, 9, 10 e J), mas no do mesmo naipe.h) uma seqncia (exceto a maior) com o mesmo naipe ( straight flush ).i) a maior seqncia (10, J, Q, K e A) com o mesmo naipe (royal straight flush ).

    19. Num dado viciado a probabilidade de cair um certo nmero proporcional a este nmero.a) Qual a probabilidade de cada nmero?

    b) Qual a probabilidade de, em uma jogada, o nmero ser no mnimo 4?c) Qual a probabilidade de, em duas jogadas, a soma ser no mximo 9?

    20. Considere que a probabilidade de um recm nascido ser menino igual a de ser menina. Nestecaso, qual a probabilidade de um casal com quatro filhos:

    a) ter exatamente 2 meninas. b) ter, no mximo, 2 meninos.c) ter pelo menos 1 menina.d) o mais velho ser um menino.

  • 8/12/2019 Sartoris - Estatstica e Introduo Econometria

    20/332

    1821. Em um milho de nascimentos foram registrados 509.718 meninas e 490.282 meninos.Considerando esta proporo (aproximadamente) uma estimativa mais realista para a probabilidadede nascimento de meninas e meninos, refaa os clculos do exerccio anterior.

    22. Entre as mulheres solteiras de uma cidade, 70% so morenas e 30% loiras. Entre as morenas,60% tm olhos castanhos, 30% tm olhos verdes e 10% tm olhos azuis. J entre as loiras, 40% tmolhos castanhos, 30% verdes e 30% azuis. Para um homem que vai num encontro s escuras, qual

    a probabilidade de que a pessoa que vai encontrar:a) tenha olhos azuis. b) seja loira de olhos verdes.c) seja morena de olhos castanhos.d) caso tenha olhos castanhos, seja loira.e) caso tenha olhos verdes, seja morena.

    23. Dado um espao amostral definido num plano cartesiano:S = {(x,y) 2 | -1 x 3; 2 y 4}e dado o conjunto A:A = {(x,y) 2 | 1 x < 2; 3 < y < 4}Calcule P(A). (Sugesto: encontre graficamente S e A ).

    24. Dados os conjuntos A, B e C no vazios cujas probabilidades so dadas por P(A), P(B) e P(C).Determine P(ABC).(Sugesto: use um diagrama semelhante ao do exemplo 1.4.3 )

    25. Segundo as pesquisas eleitorais, o candidato A tem 30% das preferncias dos eleitores.Admitindo que este valor esteja correto, se tomarmos 5 eleitores ao acaso, qual a probabilidade de:

    a) exatamente 3 deles votarem no candidato A. b) no mximo 2 deles votarem no candidato A.c) pelo menos um deles votar no candidato A.

    26. Em uma urna h 6 bolas que podem ser brancas ou pretas. Se 3 bolas retiradas ao acaso, comreposio, so brancas, qual a probabilidade de no haver bolas pretas?

    27. A probabilidade que um jogador de basquete acerte um arremesso p. Determine o valor de p para que a probabilidade de fazer pelo menos uma cesta a cada dois arremessos seja de 80%.

    28. Mostre que, se vlida a expresso: P(A|B) = P(A|B ), ento A e B so independentes.

  • 8/12/2019 Sartoris - Estatstica e Introduo Econometria

    21/332

    19APNDICE 1.A Reviso de Anlise Combinatria

    1.A.1 Fatorial

    Define-se como o fatorial de um nmeron (n!), sendo este nmero um inteiro maior do que1:

    n! = n(n-1)... 1Assim sendo:

    2! = 21 = 23! = 321 = 64! = 4321 = 245! = 54321 = 1206! = 654321 = 720

    E assim sucessivamente.

    Note que:3! = 32!4! = 43!5! = 54!6! = 65!

    Ou, generalizando:n! = n(n-1)! , n>2

    Se estendermos esta propriedade para n=2:2! = 21!

    1! = 2!2= 1

    Ento, convenientemente definimos:1! =1

    Se continuarmos para n=1:1! = 10!0! =

    1!1 = 1

    Portanto, temos:n! = n(n-1)... 1 , n>11! = 10! = 1

    1.A.2 Permutaes

    Quantos anagramas so possveis a partir da palavra amor?

    AMOR MAOR OAMR RAMO

  • 8/12/2019 Sartoris - Estatstica e Introduo Econometria

    22/332

    20AMRO MARO OARM RAOMARMO MORA OMRA RMOAAROM MOAR OMAR RMAOAOMR MRAO ORAM ROAMAORM MROA ORMA ROMA

    Portanto, so possveis 24 anagramas. Os anagramas so as permutaes (trocas de lugar)

    das letras da palavra. Temos ento, no caso P4 (l-se permutaes de 4 elementos) anagramas.Se a palavra fosse castelo, o exerccio acima seria muito mais trabalhoso. Como fazer,

    ento? Na palavra amor temos 4 espaos onde podemos colocar as 4 letras.

    No 1o espao podemos colocar qualquer uma das 4 letras. Para cada letra colocada no 1o espao, sobram 3 letras para preencher o 2o espao; uma vez preenchido este espao, sobram apenas2 para o 3o; finalmente, sobrar uma ltima letra no 4o espao. Assim

    P4 = 4321 = 4! = 24

    Generalizando:Pn = n!

    Portanto, o total de anagramas da palavra castelo :

    P7 = 7! = 5040

    1.A.3 Arranjos

    Utiliza-se um arranjo quando se quer formar grupos a partir de um conjunto maior em que aordem importante. Por exemplo, de um grupo de 5 pessoas, deseja-se montar uma chapa parauma eleio composta por um presidente, um vice e um tesoureiro.

    H 3 vagas. Para a vaga de presidente, temos 5 opes; escolhido o presidente, temos 4opes para vice, sobrando 3 opes para tesoureiro. Ento o nmero total de chapas ser dado porA5,3 (l-se arranjos de 5 elementos, 3 a 3) calculado assim:

    A5,3 = 543 = 60

    Seriam 60 chapas possveis, portanto. Faltaria, para completar o 5!, multiplicar por 2 e por 1.Multiplicando e dividindo, temos:

    A5,3 = 1212345

    =

    !2!5

    Generalizando, temos

    An,k = k)!-(nn!

    1.A.4 Combinaes

  • 8/12/2019 Sartoris - Estatstica e Introduo Econometria

    23/332

    21 Quando falamos em combinaes, como em arranjos, estamos querendo formar grupos a partir de um conjunto de elementos, a diferena que a ordemno importa.

    Suponhamos que, no exemplo anterior, a chapa no tenha cargos ( uma chapa para umconselho, por exemplo), ento no importa quem escolhido primeiro. O total de chapas possveisser dado pelo nmero de arranjos, descontando-se uma vez escolhida a chapa, trocando-se as posies na mesma (isto , fazendo permutaes) teremos uma chapa idntica. Portanto, o nmero

    de chapas ser dado por C5,3 (l-se combinaes de 5 elementos, 3 a 3) calculado por:

    C5,3 =3

    5,3

    PA

    =!3!2

    !5

    = 10

    Generalizando:

    Cn,k = k)!-(nk!n!

    1.A.5 Tringulo de Pascal

    Uma maneira simples de calcular combinaes atravs do Tringulo de Pascal:0 11 1 12 1 2 13 1 3 3 14 1 4 6 4 15 1 5 10 10 5 16 1 6 15 20 15 6 17 1 7 21 35 35 21 7 1

    A construo do Tringulo simples. Cada linha comea e termina com 1. Os outrosnmeros de cada linha so obtidos atravs da soma do nmero acima com o nmero sua esquerda.Por exemplo, o 3o nmero da linha correspondente ao nmero 5 (que 10) pode ser obtido pelasoma do 2o e do 3o nmeros da linha acima (4 + 6). E assim pode ser feito com qualquer nmeroapresentado no Tringulo, inclusive para linhas que no foram mostradas (8,9, 10, etc.).

    As combinaes podem ser obtidas imediatamente. Poe exemplo, se quisermos combinaesde 6 elementos, devemos utilizar os nmeros da linha correspondente, que so 1, 6, 15, 21, 15, 6 e1. Temos que (verifique!):C6,0 = 1C6,1 = 6C6,2 = 15

    C6,3 = 21C6,4 = 15C6,5 = 6C6,6 = 1

    E assim podemos obter quaisquer combinaes que quisermos diretamente do Tringulo.

    Adicionalmente, uma outra propriedade (entre muitas) que pode ser obtida do Tringulo que a soma dos nmeros de uma linha exatamente a potncia de 2 do nmero correspondente. Porexemplo, se tomarmos a mesma linha, correspondente ao nmero 6:

  • 8/12/2019 Sartoris - Estatstica e Introduo Econometria

    24/332

    22

    1 + 6 + 15 + 21 + 15 + 6 + 1 = 64 = 26

  • 8/12/2019 Sartoris - Estatstica e Introduo Econometria

    25/332

    23APNDICE 1.B Definio Axiomtica de Probabilidade

    A idia de se definir probabilidade atravs de axiomas vem do desejo de tratar o assunto deuma maneira mais rigorosa.

    Estabelecer axiomas significa estabelecer um conjunto de regras. Estas regras devem serno menor nmero possvel. O conjunto de axiomas, entretanto, deve ser completo, no sentido de

    que qualquer afirmao envolvendo probabilidades possa ser demonstrada utilizando apenas estesaxiomas.

    Faamos antes algumas definies:

    O conjunto S de todos os resultados possveis de um experimento aleatrio chamado deespao amostral.

    Chamemos um conjunto de subconjuntos de S, para o qual a probabilidade ser definida.A este conjunto denominamosespao de eventos.

    A definio de que subconjuntos de S faro parte do espao de eventos simples se S fordiscreto, pois, neste caso, basta que definamos como o conjunto detodos os subconjuntos possveis de S (incluindo o prprio S e o vazio). No caso de um conjunto S contnuo, ou mesmo nocaso de um S muito grande devemos nos contentar com uma definio mais restrita para.

    O espao de eventos dever ter as seguintes propriedades10:I ) S II ) Se A , ento A .III) Se A e B , ento AB .IV) Se A1, A2, ... , ento = 1i Ai .

    A probabilidade ento uma funo que associa um elemento de a um nmero real, isto :

    P:

    Obedecendo aos seguintes axiomas:

    Axioma 1:Para qualquer A , P(A) 0

    Axioma 2P(S) = 1

    Axioma 3Dados A1, A2, ..., An , disjuntos dois a dois, temos:

    P( n 1i= Ai) = =

    n

    1ii )P(A

    Isto , a probabilidade da unio dos eventos, em sendo disjuntos, a soma das probabilidades de cada um deles.

    10 Se segue estas propriedades dito um field (sigma field ).

  • 8/12/2019 Sartoris - Estatstica e Introduo Econometria

    26/332

    24

    O espao de probabilidade ser a terna (S,, P) onde S o conjunto universo (espaoamostral), um conjunto de subconjuntos de S e P uma funo que associa as probabilidades aoselementos de.

    Todas as propriedades de probabilidade podem ser estabelecidas a partir dos trs axiomasestabelecidos acima11. Vejamos algumas delas:

    Teorema 1.B.1Se A , ento P(A) = 1 - P( A )Demonstrao:

    Pela prpria definio de complementar, temos:AA = S

    Pelo axioma 2:P(S) = P(AA ) = 1

    E como A eA so disjuntos, temos, pelo axioma 3:P(AA ) = P(A) + P(A ) = 1

    Portanto:P(A) = 1 - P(A )

    Teorema 1.B.2P() = 0Demonstrao:

    Se A =, ento A = S. Lembrando que, P(S) = 1 pelo axioma 2 e utilizando o teorema1.B.1:

    P() = 1 P(S) = 1 1 = 0

    Teorema 1.B.3Se A, B , ento P(A) = P(AB) + P(AB )Demonstrao:

    AS = A

    Pela definio de complementar:A(BB ) = A

    Como a interseco tem a propriedade distributiva:(AB)(AB) = A

    E sendo os conjuntos AB e AB disjuntos temos, pelo axioma 3:P(A) = P[(AB)(AB )] = P(AB) + P(AB )

    Teorema 1.B.4Se A, B , ento P(AB) = P(A) + P(B) - P(AB)Demonstrao:

    11 Estes axiomas foram estabelecidos por Andrei Kolmogorov, matemtico russo considerado o pai da moderna teoriade probabilidade, em 1933. Antes de Kolmogorov, o axioma 3 era limitado ao caso de dois conjuntos, isto : se A e Bso disjuntos, ento P(AB) = P(A) + P(B).

  • 8/12/2019 Sartoris - Estatstica e Introduo Econometria

    27/332

    25

    Temos que:(AB)S = AB

    Pela definio de complementar:(AB)(BB) = AB

    Como a unio tambm tem a propriedade distributiva, colocando B em evidncia:B(AB ) = AB

    Os eventos B e AB so disjuntos, pelo axioma 3 temos:P[B(AB )] = P(B) + P(AB )

    E, pelo teorema 1.B.3 temos:P(A) = P(AB) + P(AB )P(AB ) = P(A) P(AB)

    Logo:

    P(AB) = P[B(AB )] = P(B) + P(A) P(AB)

  • 8/12/2019 Sartoris - Estatstica e Introduo Econometria

    28/332

    26

  • 8/12/2019 Sartoris - Estatstica e Introduo Econometria

    29/332

    27CAPTULO 2 - MEDIDAS DE POSIO E DISPERSO

    2.1 Varivel aleatriaVarivel aleatria (v.a.) uma varivel que est associada a umadistribuio12 de

    probabilidade. Portanto, uma varivel que no tem um valor fixo, pode assumir vrios valores.

    O valor que cai ao se jogar um dado, por exemplo, pode ser 1, 2, 3, 4, 5 ou 6, com probabilidade igual a

    61 para cada um dos valores (se o dado no estiver viciado). , portanto, uma

    varivel aleatria.Assim como so variveis aleatrias: o valor de uma ao ao final do dia deamanh; o

    nmero de pontos de um time num campeonato que est comeando esta semana; a quantidade dechuva que vai cair no ms que vem; a altura de uma criana em fase de crescimento daqui a seismeses; a taxa de inflao no ms que vem. Todas estas variveis podem assumir diferentes valores eestes por sua vez esto associados a probabilidades

    E no so variveis aleatrias: o valor de uma ao no final do prego deontem; o nmerode pontos de um time num campeonato que j acabou; a altura de uma pessoa na faixa dos 30 anos

    de idade daqui a seis meses; a rea til de um apartamento; a velocidade de processamento de umcomputador. Todas estas variveis tm valores fixos.2.2. Medidas de posio central2.2.1 Mdia

    H diferentes tipos de mdia: amdia aritmtica, a mais comum, a soma dos elementosde um conjunto dividido pelo nmero de elementos. Assim, um grupo de 5 pessoas, com idades de21, 23, 25, 28 e 31, ter mdia (aritmtica) de idade dada por:

    X =21+23+25+28+31

    5 = 25,6 anos

    De um modo geral, a mdia aritmtica ser dada por:

    X =X + X +...+X

    n1 2 n

    Ou, escrevendo de uma maneira mais resumida:

    X =1n Xii=1

    n

    A mdia aritmtica tambm pode ser ponderada isto no um tipo diferente de mdia

    ponderar significa atribuir pesos. Ter um peso maior significa simplesmente que aquele valor

    entrar mais vezes na mdia. Digamos, por exemplo, que em trs provas um aluno tenha tirado 4,6 e 8. Se a mdia no for ponderada, bvio que ser 6.Se, no entanto, a mdia for ponderada da seguinte forma: a primeira prova com peso 1, a

    segunda com 2 e a terceira 3. A mdia ser calculada como se as provas com maior peso tivessemocorrido mais vezes, ou seja

    X =4 6 6 8 8 8

    6+ + + + +

    12 Voltaremos ao conceito de distribuio de probabilidade no prximo captulo.

  • 8/12/2019 Sartoris - Estatstica e Introduo Econometria

    30/332

    28 Ou, simplesmente:

    X =4 1 6 2 8 3

    6 + +

    6,7

    Os pesos podem ser o nmero de vezes que um valor aparece. Suponhamos que numa classede 20 alunos haja 8 com idade de 22 anos, 7 de 23, 3 de 25, um de 28 e um de 30. A quantidade quecada nmero aparece no conjunto chamada defreqncia (freqncia absoluta neste caso, pois setrata da quantidade de alunos com determinada idade). A mdia de idade ento ser dada por:

    X =22 8 23 7 25 3 28 1 30 1

    20 + + + +

    = 23,5 anos

    A freqncia tambm pode ser expressa em propores, sendo chamada neste caso defreqncia relativa. No exemplo anterior, h 8 alunos com 22 anos de idade em um total de 20, portanto nesta classe h 820 = 0,4 = 40% dos alunos com esta idade. Da mesma forma, temos 35%com 23, 15% com 25 e 5% com 28 e 30, respectivamente. A mdia de idade pode ser calculada daseguinte forma:

    X= 220,4 + 230,35 + 250,15 + 280,05 + 300,05 = 23,5Repare que o segundo jeito de calcular (usando a freqncia relativa) nada mais do que o

    primeiro (usando a freqncia absoluta) simplificando-se a frao (dividindo o valor dos pesos pelonmero total).

    Um outro tipo de mdia a mdia geomtrica. A mdia geomtrica para o aluno que tirounotas 4, 6 e 8 ser:

    G = 4 6 83 5,8Ou, genericamente:

    G = X X Xnn 1 2 ...

    Ou ainda, de uma maneira mais resumida:

    G = Xii=1

    n 1n

    Repare que a mdia geomtrica zera se um dos elementos for zero.A mdia geomtrica tambm pode ser ponderada: se os pesos das provas forem 1, 2 e 3, ela

    ser dada por:

    G = 4 6 81 2 36 6,5H ainda um terceiro tipo de mdia, a mdia harmnica. No exemplo das notas, ela ser

    dada por:

    H = 114

    16

    18

    3

    + += 31

    416

    18+ +

    5,5

    De um modo geral:

    H =n

    X X X1 n1 1 1

    2+ + +....

  • 8/12/2019 Sartoris - Estatstica e Introduo Econometria

    31/332

    29 Ou ainda:

    H =n1X ii=1

    n

    Tambm possvel que a mdia harmnica seja ponderada. Repetindo o exemplo anterior:

    H = 614 1

    16 2

    18 3

    + + 6,3

    Foi possvel notar, tanto para as mdias simples (sem pesos) como para as ponderadas que,em geral, a mdia aritmtica maior do que a mdia geomtrica e esta por sua vez maior do que aharmnica. Isto verdade, exceto, obviamente, quando os valores so todos iguais. Temos entoque:

    X G H

    Exemplo 2.2.1.1Um aluno tira as seguintes notas bimestrais: 3; 4,5; 7 e 8,5. Determine qual seria sua mdia final seesta fosse calculada dos trs modos (aritmtica, geomtrica e harmnica), em cada um dos casos:a) as notas dos bimestres tm os mesmos pesos

    Neste caso, a mdia aritmtica final seria:

    X =4

    5,875,43 +++ =423

    X = 5,75

    A mdia geomtrica seria:G = 4 5,875,43 = 4 25,803

    G 5,32

    E a harmnica seria:

    H =

    5,81

    71

    5,41

    31

    4

    +++

    H 4,90

    b) Supondo que os pesos para as notas bimestrais sejam 1, 2, 3 e 4.

    Agora os pesos dos quatro bimestres totalizam 10, portanto a mdia aritmtica final ser:

    X =10

    5,84735,4231 +++ =1067

    X = 6,7

    A geomtrica ser:G = 10 4321 5,875,43 G 6,36

    E a harmnica:

  • 8/12/2019 Sartoris - Estatstica e Introduo Econometria

    32/332

    30

    H =

    5,84

    73

    5,42

    31

    10

    +++

    H 5,96

    c) Supondo que os pesos sejam, respectivamente, 30%, 25%, 25% e 20%.Agora os pesos so dados em termos relativos (percentuais) e somam, portanto, 1.

    O clculo da mdia aritmtica ser, ento:X = 0,33 + 0,254,5 + 0,257+ 0,28X = 5,475

    O da mdia geomtrica ser:G = 30,34,50,2570,258,50,2 G 5,05

    E a harmnica:

    H =2,0

    5,8125,0

    7125,0

    5,413,0

    31

    1+++

    H 4,66

    Exemplo 2.2.1.2(dados agrupados)Foram medidas as alturas de 30 pessoas que esto mostradas na tabela abaixo (as medidas so emcentmetros).

    159 168 172 175 181161 168 173 176 183162 169 173 177 185164 170 174 178 190166 171 174 179 194167 171 174 180 201

    Agrupe estas pessoas emclasses de 10cm e faa ohistograma correspondente.

    Para agrupar em classes de 10cm, o mais lgico (mas no obrigatrio) seria agrupar em: de150 a 160; de 160 a 170, e assim sucessivamente. O problema , onde incluir aqueles que tm, porexemplo, exatamente 170 cm? Na classe de 160 a 170 ou na de 170 a 180? H que se escolher uma,mas esta escolha completamente arbitrria. Vamos optar por incluir sempre o limite inferior, porexemplo, a classe de 170 a 180 inclui todas as pessoas com 170 cm (inclusive) at 180 cm

    (exclusive)13

    , para o que utilizaremos a notao [170; 180[.Ento, para os valores da tabela acima, teremos:

    [150; 160[ 1[160; 170[ 8[170; 180[ 14[180; 190[ 4[190; 200[ 2

    13 Em linguagem de conjuntos equivaleria a dizer que o conjunto fechado em 170 e aberto em 180.

  • 8/12/2019 Sartoris - Estatstica e Introduo Econometria

    33/332

    31

    [200; 210[ 1

    Umhistograma uma maneira grfica de representar este agrupamento, utilizando-se deretngulos cuja altura proporcional ao nmero de elementos em cada classe.

    O histograma para o agrupamento realizado mostrado na figura abaixo:

    02468

    10121416

    150 160 170 180 190 200 210

    Exemplo 2.2.1.3A partir dos dados agrupados do exemplo anterior, calcule a mdia14.

    Utilizaremos como dados os agrupamentos, como se (e freqentemente isso acontece) notivssemos conhecimento dos dados que originaram este agrupamento.

    J que a nossa nica informao o agrupamento (seja pela tabela, seja pelo histograma),no possvel sabercomo os dados se distribuem pelo agrupamento, ento a melhor coisa que podemos fazer (na falta de outra opo) supormos que os dados se distribuem igualmente por cadaagrupamento, de modo que, por exemplo, no agrupamento que vai de 170 a 180 como setivssemos 14 pessoas com altura de 175 cm.

    Em outras palavras, tomaremos a mdia de cada classe para o clculo da mdia total.Obviamente, a no ser por uma grande coincidncia, este no ser o valor correto da mdia, mas uma aproximao e, de novo, o melhor que se pode fazer dada a limitao da informao. Ento,temos:

    X=30

    1205219541851417581651155 +++++

    X 175,33 cm

    Repare que, o valor correto da mdia, tomando-se os 30 dados originais, de 174,5 cm.

    2.2.2 ModaModa o elemento de maior freqncia, ou seja, que aparece o maior nmero de vezes15. Noexemplo das idades na classe com 20 alunos, a moda 22 anos, que a idade mais freqente nesteconjunto.

    Pode haver, entretanto, mais de uma moda em um conjunto de valores. Se houver apenasuma moda, a distribuio chamada deunimodal. Se houver duas,bimodal.

    14 Quando se fala mdia, sem especificar, supe-se estar se tratando da mdia aritmtica.15 Assim como na linguagem cotidiana dizemos que uma roupa est na moda quando ela usada pela maioria das pessoas.

  • 8/12/2019 Sartoris - Estatstica e Introduo Econometria

    34/332

    32 2.2.3 Mediana

    Mediana o valor que divide um conjunto ao meio. Por exemplo, num grupo de 5 pessoascom alturas de 1,60m, 1,65m, 1,68m, 1,70m e 1,73m, a mediana 1,68m, pois h o mesmo nmerode pessoas mais altas e mais baixas (duas).

    A mediana apresenta uma vantagem em relao mdia: no grupo acima, a mdia 1,672m,ento, neste caso, tanto a mdia como a mediana nos do uma idia razovel do grupo de pessoasque estamos considerando. Se, no entanto, retirarmos a pessoa de 1,73m, substituindo-a por outra de2,10m, a mdia passar a ser 1,746m.

    Neste caso, a mdia no seria muito representativa de um grupo que, afinal de contas, temapenas uma pessoa acima de 1,70m. A mediana, entretanto, fica inalterada.

    A mediana, ao contrrio da mdia,no sensvel a valores extremos.Seguindo a mesma lgica, osquartis so os elementos que dividem o conjunto em quatro

    partes iguais. Assim, o primeiro quartil aquele elemento que maior do que41 dos elementos e,

    portanto, menor do que43 dos mesmos; o segundo quartil (que coincide com a mediana) aquele

    que divide,42 para cima

    42 para baixo; finalmente o terceiro quartil aquele elemento que tem

    43 abaixo e

    41 acima.

    Da mesma forma, se dividirmos em 8 pedaos iguais, teremos osoctis, decis se dividirmosem 10, e, mais genericamente ospercentis: o percentil de ordem 20 aquele que tem abaixo de si20% dos elementos, e 80% acima.

    Exemplo 2.2.3.1A partir da tabela apresentada no exemplo 2.2.1.1, determine:a) a moda

    O elemento que aparece mais vezes (3) 174 cm, portanto:Mo = 174 cm

    E s h uma moda, o que no necessrio que ocorra. No caso deste exemplo, bastaria quehouvesse mais uma pessoa com 168 cm de altura para que esta distribuio se tornasse bimodal.

    b) a medianaH 30 dados. Do menor para o maior, o 15o dado , pela ordem, 173 cm, enquanto o 16o

    174 cm. Como a mediana deve ter 15 elementos abaixo e 15 acima, tomaremos o ponto mdio entreo 15o e o 16o dado:

    Md =2

    174173+

    Md = 173,5 cm

    c) o 1o e 2o quartis.Devemos dividir o total de elementos por 4, o que d 7,5. Como o 7o e o 8o elemento, indo

    do menor para o maior, so iguais, temos:1o quartil = 168 cm

  • 8/12/2019 Sartoris - Estatstica e Introduo Econometria

    35/332

    33

    O 2o quartil coincide com a mediana:2o quartil = Md = 173,5 cm

    2.3. Medidas de disperso muito comum ouvirmos: em estatstica, quando uma pessoa come dois frangos enquanto

    outra passa fome, na mdia ambas comem um frango e esto, portanto, bem alimentadas; ou, seuma pessoa est com os ps em um forno e a cabea em um freezer , na mdia, experimenta umatemperatura agradvel. claro que estas situaes tem que ser percebidas (e so!) pela estatstica.Para isso que servem as medidas de disperso, isto , medidas de como os dados esto agrupados:mais ou menos prximos entre si (menos ou mais dispersos).

    2.3.1 Varincia Uma das medidas mais comuns de disperso a varincia. Tomemos o exemplo dos frangos

    para trs indivduos. Na situao 1 h uma diviso eqitativa enquanto na situao 2, um indivduocome demais e outro passa fome.

    Situao 1 Situao 2indivduo1 1 2indivduo2 1 1indivduo3 1 0

    claro que, em ambas as situaes, a mdia 1 frango por indivduo. Para encontrar umamaneira de distinguir numericamente as duas situaes, uma tentativa poderia ser subtrair a mdiade cada valor:

    Situao 1 Situao 2indivduo1 1 - 1 = 0 2 1 = 1 indivduo2 1 - 1 = 0 1 1 = 0 indivduo3 1 - 1 = 0 0 - 1 = -1

    MDIA 0 0

    O que no resolveu muito, pois a mdia dos desvios em relao mdia16 (valor menos amdia) continua igual. Mais precisamente, ambas so zero. Isto ocorre porque, na situao 2, osvalores abaixo da mdia (que ficam negativos) compensam os que ficam acima da mdia(positivos).

    Para se livrar deste inconveniente dos sinais podemos elevar todos os valores encontrados aoquadrado.

    Situao 1 Situao 2indivduo1 (1 - 1)2 = 0 (2 - 1)2 = 1 indivduo2 (1 - 1)2 = 0 (1 - 1)2 = 0

    16 Alis, valeria a pena lembrar quesempre a soma dos desvios em relao mdia zero.

  • 8/12/2019 Sartoris - Estatstica e Introduo Econometria

    36/332

    34indivduo3 (1 - 1)2 = 0 (0 - 1)2 = 1

    MDIA 0 2/3

    E, desta forma, conseguimos encontrar uma medida que distingue a disperso entre as duassituaes.

    Na situao 1, no h disperso todos os dados so iguais a varincia zero. Na situao 2, a disperso (obviamente) maior encontramos uma varincia de 2/3

    0,67.Basicamente, encontramos a varincia subtraindo todos os elementos do conjunto pela

    mdia, elevamos o resultado ao quadrado e tiramos a mdia dos valores encontrados. Portanto, avarincia de um conjunto de valores X, que chamaremos de var(X) ou2X ser dada por:

    var(X) 2X =(X - X) + (X - X) +...+(X - X)

    n1

    22

    2n

    2

    Ou ainda:

    var(X) = 1n (X - X)i2

    i=1

    n

    Varincia , portanto, umamedida de disperso, quelembra quadrados. Este ltimoaspecto, alis, pode ser um problema na utilizao da varincia.

    Na situao 2 do exemplo anterior (que tratava de frangos), encontramos uma varincia de0,67...frangos ao quadrado? Sim, porque elevamos, por exemplo, 1 frango ao quadrado. Damesma forma que, na geometria, um quadrado de lado 2m tem rea de (2m)2 = 4m2, temos que (1frango)2 = 1 frango2! E assim tambm valeria para outras variveis: renda medida em reais oudlares teria varincia medida em reais ao quadrado ou dlares ao quadrado.

    Alm da estranheza que isto poderia causar, dificulta, por exemplo uma comparao com amdia.

    Para eliminar este efeito, utiliza-se uma outra medida de disperso que , na verdade, uma pequena alterao da varincia.

    Exemplo 2.3.1.1 (varincia a partir de dados agrupados)Utilizando o agrupamento do exemplo 2.2.1.2, determine a varincia.

    A varincia calculada com o mesmo princpio utilizado para a mdia, ou seja, tomando-se

    o valor mdio de cada classe como representativo da mesma. Assim:

    var(X) =301

    [(155-175,33)21+(165-175,33)28+(175-175,33)214+(185-175,33)24+(195-175,33)22+(205-175,33)21]

    var(X) 108,89 Mais uma vez, uma aproximao. Verifique que o valor correto da varincia (utilizando os

    dados iniciais) de 86,92.2.3.2. Desvio padro

  • 8/12/2019 Sartoris - Estatstica e Introduo Econometria

    37/332

    35 Para eliminar o efeito dos quadrados existente na varincia basta extrairmos a raiz quadrada.Chamaremos de desvio padro da varivel X (dp(X) ouX):

    dp(X) X = var(X)

    Portanto, o desvio padro na situao 2 do exemplo dos frangos ser dado por:

    dp(X) = 0 67, 0,8 frangosEstando na mesma unidade dos dados (e da mdia), no caso especfico, frangos, possvel

    comparar o desvio padro com a mdia: neste caso, o desvio padro 80%17 da mdia. Note-se que, se o objetivo a comparao entre dois conjuntos de dados, tanto faz usar a

    varincia ou o desvio padro. Se a varincia maior, o desvio padro tambm maior (e vice-versa) necessariamente.

    2.3.3. Outra maneira de calcular a varinciaSe, a partir da definio de varincia, desenvolvermos algebricamente, obteremos:

    var(X) =1n (X - X)i

    2

    i=1

    n

    var (X) =

    1n (X - 2X X + Xi

    2i

    2

    i=1

    n

    )

    var(X) =1n Xi

    2

    i=1

    n

    - 1n 2X Xii=1n

    + 1n X2

    i=1

    n

    var(X) =1n Xi

    2

    i=1

    n

    - 2X 1n Xii=1n

    + 1n nX2

    var(X) =1

    nX

    i

    2

    i=1

    n

    - 2 2X + X2

    var(X) =1n Xi

    2

    i=1

    n

    - X2 Ou, em outras palavras:

    var(X) = mdia dos quadrados - quadrado da mdiaUtilizando este mtodo para calcular a varincia da situao 2 do exemplo dos frangos:

    Situao 2 ao quadrado

    indivduo1 2 4

    indivduo2 1 1indivduo3 0 0

    MDIA 1 5/3

    var(X) = mdia dos quadrados - quadrado da mdia = 5/3 - 12 = 2/3

    17 Esta proporo, que obtida atravs da diviso do desvio padro pela mdia, tambm chamada de coeficiente devariao.

  • 8/12/2019 Sartoris - Estatstica e Introduo Econometria

    38/332

    36 Encontramos o mesmo valor.

    Tomemos agora o exemplo de um aluno muito fraco, que tem as seguintes notas em trsdisciplinas:aluno A notas ao quadrado

    economia 3 9

    contabilidade 2 4administrao 4 16matemtica 1 1

    MDIA 2,5 7,5Para este aluno, temos:

    X = 2,5var(X) = 7,5 - 2,52 = 1,25dp(X) = 1,12

    Suponha agora um aluno B, mais estudioso, cujas notas so exatamente o dobro:aluno B notas ao quadradoeconomia 6 36contabilidade 4 16administrao 8 64matemtica 2 4

    MDIA 5 30

    Para o aluno B, os valores so:X = 5

    Isto , se os valores dobram, a mdia dobra.var(X) = 30 - 52 = 5 =41,25

    Ou seja, se os valores dobram, a varincia quadruplica. Isto porque varincia lembraquadrados. Em outras palavras, vale a relao18:

    var(aX) =a2var(X) (2.3.3.1)dp(X) = 2,24

    Isto , o desvio padro dobra, assim como a mdia. Vale, portanto, a relao:dp(aX) =a .dp(X) (2.3.3.2)

    Agora tomemos um aluno C, ainda mais estudioso, que tira 5 pontos a mais do que o alunoA em todas as matrias:

    aluno C notas ao quadrado

    18 Veja demonstrao no apndice

  • 8/12/2019 Sartoris - Estatstica e Introduo Econometria

    39/332

    37economia 8 64contabilidade 7 49administrao 9 81matemtica 6 36

    MDIA 7,5 57,5

    Para este aluno teremos:X = 7,5

    Se o aluno tira 5 pontos a mais em cada disciplina, a mdia tambm ser de 5 pontos a maisvar(X) = 57,5 - 7,52 = 1,25dp(X) = 1,12

    A varincia e o desvio padro so os mesmos do aluno A. Isto porque so medidas dedisperso se somarmos o mesmo valor a todas as notas de A elas continuaro dispersas,espalhadas da mesma forma, apenas mudaro de posio. Valem portanto as relaes19:

    var(X+a) = var(X) (2.3.3.3)dp(X+a) = dp(X) (2.3.3.4)

    2.3.4. Relaes entre variveis covarinciaA covarincia pode ser entendida como uma varincia conjunta entre duas variveis.

    Enquanto a varincia sai de quadrados (da varivel menos a mdia), a covarincia definida atravsde produtos:

    cov(X,Y) =1n (X - X)(Y - Y)i ii=1

    n

    Que, assim como a varincia, pode ser calculada de outra forma:cov(X,Y) = mdia dos produtos - produto da mdia (2.3.4.1)Vejamos um exemplo do consumo e da taxa de juros de um pas:

    Ano consumo (X) taxa de juros (Y) produto (XY)

    1 800 10 80002 700 11 77003 600 13 78004 500 14 7000

    MDIA 650 12 7625

    cov(X,Y) = 7625 - 650x12 = -175

    E agora entre o consumo e a renda:

    19 Cujas demonstraes tambm podem ser vistas no apndice.

  • 8/12/2019 Sartoris - Estatstica e Introduo Econometria

    40/332

    38

  • 8/12/2019 Sartoris - Estatstica e Introduo Econometria

    41/332

    39tabela 2.3.4.1Ano consumo (X) renda (Y) produto (XY)

    1 600 1.000 600.0002 700 1.100 770.0003 800 1.300 1.040.000

    4 900 1.400 1.260.000MDIA 750 1.200 917.500

    cov(X,Y) = 917.500 - 750x1.200 = 17.500A primeira diferena que se nota entre os dois ltimos exemplos o sinal da covarincia em

    cada um deles. A covarincia negativa entre o consumo e a taxa de juros e positiva entre oconsumo e a renda. Isto porque consumo e renda caminham na mesma direo (quando aumentaum, aumenta outro e vice-versa) e quando isto ocorre o sinal da covarincia positivo.

    J o consumo e a taxa de juros se movem em direes opostas (quando aumenta um, cai

    outro e vice-versa), assim sendo, o sinal da covarincia negativo.A covarincia entre duas variveis influenciada pela importncia que uma varivel tem

    sobre a outra, de tal modo que duas variveis independentes tm covarinciazero20.Entretanto, no possvel concluir, pelos valores obtidos, que a renda mais importante do

    que a taxa de juros para a determinao do consumo s porque o valor da covarincia entre oconsumo e a renda bem maior do que o entre o consumo e a taxa de juros. Isto porque acovarincia tambm afetada pelos valores das variveis. A covarincia entre consumo e renda maior tambm porque os valores da renda so bem maiores que os da taxa de juros.

    2.3.5 Coeficiente de correlao

    O coeficiente de correlao obtido retirando-se o efeito dos valores de cada uma dasvariveis da covarincia. Isto feito dividindo-se esta ltima pelos desvios padro das variveis.

    O coeficiente de correlao dado, ento, por:

    corr(X,Y) XY = )dp(X).dp(YY)cov(X,

    No exemplo do consumo e da renda os desvios padro so, respectivamente 111,8 e 158,1(verifique!). O coeficiente de correlao ser dado por:

    XY =17500

    111 8 158 1.

    , , = 0,99

    O sinal do coeficiente de correlao o mesmo da covarincia (e deve ser interpretado damesma forma).

    20 Mas a recproca no verdadeira.

  • 8/12/2019 Sartoris - Estatstica e Introduo Econometria

    42/332

    40 Os seus valores variam apenas no intervalo de -1 a 1 e podem sem interpretados como um percentual21. Portanto, um valor de 0,99 (quase 1) indica que a renda muito importante para adeterminao do consumo.

    O valor de 1 (ou -1) para o coeficiente de correlao s encontrado para duas variveis quetenham uma relao exata e dada por uma funo do 1o grau. Por exemplo, o nmero de cadeiras ede assentos em uma sala de aula; o nmero de pessoas e dedos da mo (supondo que no hajaindivduos polidctilos, acidentados ou com defeitos congnitos entre estas pessoas); a rea til e area total em apartamentos de um mesmo edifcio.

    Valores muito pequenos (em mdulo) indicam que a varivel tem pouca influncia umasobre a outra.

    2.3.6. Outras propriedades. No exemplo do consumo e da taxa de juros, multipliquemos o consumo por 3 e a taxa de

    juros por 2:ano

    3X2Y produto

    1 2400 20 480002 2100 22 462003 1800 26 468004 1500 28 42000

    MDIA 1950 24 45750

    A nova covarincia ser dada por:cov(3X,2Y) = 45750 - 1950x24 = -1050 =6(-175)

    Ou seja, o sxtuplo da covarincia entre as variveis originais. A propriedade apresentadaaqui pode ser assim resumida:

    cov(aX,bY) =a.b .cov(X,Y) (2.3.6.1)

    21 Com ressalvas, pois ele calculado sem considerar a influncia de outras variveis.

  • 8/12/2019 Sartoris - Estatstica e Introduo Econometria

    43/332

    41Tomemos agora duas variveis X e Y:

    X Y X2 Y2 XY

    10

    1 100 1 10

    12

    3 144 9 36

    18

    2 324 4 36

    20

    2 400 4 40

    MDIA 15

    2 242 4,5 30,5

    Podemos calcular:var(X) = 242-152 = 17var(Y) = 4,5 -22 = 0,5cov(X,Y) = 30,5 - 15x2 = 0,5

    Vamos inventar duas novas variveis: X+Y e X-YX+Y X-Y (X+Y)2 (X-Y)2

    11 9 121 8115 9 225 8120 16 400 25622 18 484 324

    MDIA 17 13 307,5 185,5

    Ento temos:var(X+Y) = 307,5 - 172 = 18,5var(X-Y) = 185,5 - 132 = 16,5

    Note que poderamos obt-las dos valores anteriores da seguinte forma:var(X+Y) = 17 + 0,5 + 20,5 =18,5var(X-Y) = 17 + 0,5 - 20,5 = 16,5

    Generalizando, vem22:var(X+Y) = var(X) + var(Y) + 2cov(X,Y) (2.3.6.2)var(X-Y) = var(X) + var(Y) - 2cov(X,Y) (2.3.6.3)

    22 Note que muito semelhante forma do produto notvel (a+b)2 = a2 + b2 + 2ab, fazendo a varincia anloga aoquadrado e a covarincia anloga ao produto.

  • 8/12/2019 Sartoris - Estatstica e Introduo Econometria

    44/332

    42 Exerccios1. Num sistema de avaliao h duas provas (com notas variando de 0 a 10) e, para ser aprovado, oaluno deve ter mdia final 5. Qual a nota mnima que preciso tirar na primeira prova para terchance de ser aprovado, supondo:

    a) mdia aritmtica ponderada, com a primeira prova tendo peso 2 e a segunda 1.

    b) mdia geomtrica (simples).c) mdia harmnica (simples).

    2. Dados o conjunto {2; 3; 5; 8; 12}, calcule as mdias aritmtica, geomtrica e harmnica,supondo:

    a) pesos iguais. b) pesos 9, 7, 5, 3 e 1c) pesos 10%, 20%, 30%, 25%, 15%

    3. A partir dos dados do exemplo 2.2.1.2:a) agrupe os dados em classes de 5 cm. b) calcule a mdia e a varincia.c) comente os resultados obtidos no item anterior.d) trace o histograma correspondente.

    4. Com base nos histogramas abaixo, calcule a mdia, a varincia e o desvio padro.a)

    0

    10

    20

    30

    40

    50

    10 12 14 16 18 20 22 24

    b)

    0

    2

    4

    6

    8

    10

    12

    14

    20 25 30 35 40 45

    5. Calcule o coeficiente de correlao entre o consumo e a taxa de juros da tabela 2.3.4.1

    6. Para os dados das tabelas abaixo, calcule:

  • 8/12/2019 Sartoris - Estatstica e Introduo Econometria

    45/332

    43i) a varincia e o desvio-padro de X.ii) a varincia e o desvio-padro de Y.iii) a covarincia entre X e Y.iv) o coeficiente de correlao entre X e Y.

    a)X Y

    20 1230 1340 1445 1336 1527 11

    b)X Y114 55112 61109 77123 66111 8199 95121 75113 7798 90103 87

    7. Considere duas variveis aleatrias independentes, X e Y, cujas mdias so 10 e 12,respectivamente e suas varincias so 25 e 16. Usando as abreviaes abaixo:m(X) = mdia aritmtica de X.

    var(X) = varincia de X.dp(X) = desvio-padro de X.Determine:a) m(X + 5) b) m(5Y)c) m(3X 4Y + 7)d) var(2X)e) var(Y + 6)f) var(4X) - var(2Y + 12)g) dp(5X) + dp(6Y)h) dp(3X - 5) - dp(4Y - 8)

    8. Dadas as variveis aleatrias X, Y e Z, sendo:var(X) = 4 cov(Y,Z) = -3var(Y) = 9 X e Y so independentesvar(Z) = 1 X e Z so independentes

    Calcule:a) var(X+Y) b) var(X-Y)c) var(2X+3Y)d) var(Y+Z)

  • 8/12/2019 Sartoris - Estatstica e Introduo Econometria

    46/332

    44e) var(2Y-3Z+5)f) var(4X-2)g) corr(Z,Y)h) cov(4Z,5Y)i) cov(2Z,-2Y) j) corr(1,5Z; 2Y)

    9. O coeficiente de correlao entre X e Y 0,6. Se W = 3 + 4X e Z = 2 2Y, determine ocoeficiente de correlao entre W e Z.10. O coeficiente de correlao entre X e Y . Se W =a + bX e Z =c + d Y, determine ocoeficiente de correlao entre W e Z

  • 8/12/2019 Sartoris - Estatstica e Introduo Econometria

    47/332

    45Apndice 2.B - Demonstraes2.B.1 Demonstrao da expresso 2.3.3.1

    var(aX) =a2var(X)

    var(aX) =1n

    n

    1=i

    2i )X-X( aa

    var(aX) = 1n [ ]n

    1=i

    2i )X-(Xa

    var(aX) =1n

    n

    1=i

    2i

    2 )X-(Xa

    var(aX) =a21n (X - X)i

    2

    i=1

    n

    var(aX) =a2var(X) (c.q.d)

    2.B.2 Demonstrao da expresso 2.3.3.2dp(aX) =a .dp(X)

    dp(aX) = X)var(a

    dp(aX) = var(X)2a

    dp(aX) = var(X)a

    dp(aX) =a .dp(X) (c.q.d.)

    2.B.3 Demonstrao da expresso 2.3.3.3var(X+a) = var(X)

    var(X+a) =1n [ ] +

    n

    1=i

    2i )X(-+X aa

    var(X+a) =1n [ ]

    n

    1=i

    2i )-X-+X aa

    var(X+a) =1n (X - X)i

    2

    i=1

    n

    var(X+a) = var(X) (c.q.d.)

    2.B.4 Demonstrao da expresso 2.3.3.4dp(X+a) = dp(X)

    dp(X+a) = )+var(X a

    dp(X+a) = var(X)

  • 8/12/2019 Sartoris - Estatstica e Introduo Econometria

    48/332

    46 dp(X+a) = dp(X) (c.q.d.)

    2.B.5 Demonstrao da expresso 2.3.4.1cov(X,Y) = mdia dos produtos - produto da mdia

    cov(X,Y) =1

    n(X - X)(Y - Y)

    i ii=1

    n

    cov(X,Y) =1n (X Y - X Y- XY + XY)i i i ii=1

    n

    cov(X,Y) =1n X Yi ii=1

    n

    - 1n X Yii=1n

    - 1n XYii=1n

    + 1n XYi=1n

    cov(X,Y) =1n X Yi ii=1

    n

    -Y 1n Xii=1n

    - X 1n Yii=1n

    + 1n nXY

    cov(X,Y) =1

    nX Yi i

    i=1

    n

    -XY-XY+XY

    cov(X,Y) =1n X Yi ii=1

    n

    -XYcov(X,Y) = mdia dos produtos - produto da mdia (c.q.d.)

    2.B.6 Demonstrao da expresso 2.3.6.1cov(aX,bY) = a.b.cov(X,Y)

    cov(aX,bY) =1

    n

    n

    1=iii )Y-Y)(X-X( bbaa

    cov(aX,bY) =1n

    n

    1=iii )Y-(Y)X-(X ba

    cov(aX,bY) = a.b.1n (X - X)(Y - Y)i ii=1

    n

    cov(aX,bY) =a .b.cov(X,Y)

    2.B.7 Demonstrao da expresso 2.3.6.2

    var(X+Y) = var(X) + var(Y) + 2cov(X,Y)var(X+Y) =

    1n (X Y )i i

    2

    i=1

    n

    + - ( )X Y+ 2

    var(X+Y) =1n (X Y + 2X Y )i i

    2i i

    i=1

    n2 + - ( )X Y XY2 2 2+ +

    var(X+Y) =(1n Xii=1

    n2 - X2 ) + (1n Yi

    2

    i=1

    n

    -Y2 ) + 2(1n X Yi ii=1n

    -XY)

  • 8/12/2019 Sartoris - Estatstica e Introduo Econometria

    49/332

    47 var(X+Y) = var(X) + var(Y) + 2cov(X,Y) (c.q.d.)

    2.B.8 Demonstrao da expresso 2.3.6.3var(X-Y) = var(X) + var(Y) - 2cov(X,Y)

    var(X-Y) = var[X+(-Y)]

    var(X-Y) = var(X) + var(-Y) + 2cov(X,-Y)var(X-Y) = var(X) + var(Y) - 2cov(X,Y) (c.q.d.)

  • 8/12/2019 Sartoris - Estatstica e Introduo Econometria

    50/332

    48

  • 8/12/2019 Sartoris - Estatstica e Introduo Econometria

    51/332

    49

    CAPTULO 3 DISTIBUIO DE PROBABILIDADE

    Suponha que voc compra uma ao de uma companhia ao preo de R$ 20 e que, aps umms, pretende vend-la. Suponha ainda que, por algum motivo qualquer, ao final de um ms, estaao s pode estar valendo os mesmos R$ 20, com probabilidade de 50%; ter cado para R$ 15, com probabilidade de 30%; ou ainda, ter subido para R$ 25, com probabilidade de 20%. S estes trsvalores so possveis, tendo em vista que as respectivas probabilidades somam exatamente 100%.

    Temos a uma distribuio de probabilidade associada ao preo da ao, isto , cada um dosvalores possveis desta ao (s 3, neste caso) tem uma probabilidade correspondente. Comodefinimos no captulo anterior, isto caracteriza o preo da ao como uma varivel aleatria.

    E, como o conjunto de valores do preo da ao um conjunto discreto, esta umadistribuio de probabilidade discreta ou, em outras palavras, uma distribuio de probabilidadede uma varivel aleatria discreta. Poderamos ter uma distribuio contnua (o que, alis, provavelmente seria mais adequado considerando-se que se trata do preo de uma ao), mas istofica para mais adiante no captulo. Por enquanto trataremos de distribuies discretas.

    3.1 Esperana Matemtica

    Uma pessoa que compre a ao citada acimapode sair ganhando,pode perder ou at ficarna mesma, dependendo do que acontea com o preo da ao. Ento, na mdia, d na mesma, certo?

    Errado! A probabilidade de que a ao caia maior do que a ao suba. O valor mdio do preo da ao :

    150,3 + 200,5 + 250,2 = R$ 19,50

    O valor mdio 50 centavos abaixo do preo inicial da ao, o que significa que, em mdia,quem comprar esta ao sair perdendo.

    Mas este um valor mdioesperado. uma mdia do quepode acontecer com a varivel, baseado na sua distribuio de probabilidade. o que chamamos deEsperana Matemtica ou,simplesmente, Esperana.

    A Esperana de uma varivel aleatria discreta X, E(X), pode ser definida, ento, como:

    E(X) = X1P(X1) + X2P(X2) +...+ XnP(Xn) = =

    n

    1iii )P(XX

    A probabilidade aqui tem o mesmo papel da freqncia relativa do captulo anterior. Adiferena que, quando falamos em freqncia relativa usualmente nos referimos a uma quantidadeobtida, enquanto probabilidade se refere, obviamente, a propores que a varivel pode assumirdeterminado valor 23.

    23 A diferena ficar mais clara no captulo 5 quando falarmos em valores amostrais e populacionais. Podemos imaginara freqncia relativa como sendo o valor amostral, enquanto a probabilidade o valor populacional. Ou ainda,lembrando o captulo 1, pela abordagem freqentista, a probabilidade o limite da freqncia relativa quando temos umnmero muito grande de experimentos.

  • 8/12/2019 Sartoris - Estatstica e Introduo Econometria

    52/332

    50 Alis, podemos pensar em P(X) como uma funo que associa o valor de X sua probabilidade, que chamada de funo de probabilidade.

    Uma outra funo importante que pode ser associada s probabilidades a funo que, dadoo valor de X, nos fornece a probabilidade acumulada, e que chamamosfuno de distribuioacumulada, ou simplesmente, funo de distribuio, que representamos por F(X).

    Se X for o preo da ao que falamos no incio do captulo, ento X s pode assumir 3valores, isto , 15, 20 e 25. F(15) seria a probabilidade do preo da ao ser, no mximo, 15, o que exatamente 30%. F(20) a probabilidade de ser at 20 que, neste caso, equivale probabilidade deser 15 ou 20, que 80%. Finalmente, F(25) a probabilidade de ser, no mximo, 25, isto , de ser15, 20, ou 25 que , obviamente 100%. Esta uma caracterstica das funes de distribuio, oltimo valor 24 da funo 1 (100%).

    0%

    10%

    20%30%

    40%

    50%

    60%

    15 20 25

    P (X)

    Funo de probabilidade

    0%

    20%

    40%

    60%

    80%

    100%

    120%

    15 20 25

    F(X)

    Funo distribuio acumulada

    Nos grficos acima o formato de histograma foi utilizado para uma melhor visualizao, nosendo, evidentemente, obrigatrio, embora seja adequado para uma varivel aleatria discreta.

    Exemplo 3.1.1 Num sorteio de nmeros inteiros de 1 a 5, a probabilidade de um nmero ser sorteado proporcional a este nmero (isto , a probabilidade do nmero 5 ser sorteado cinco vezes a probabilidade do nmero 1 ser sorteado). Qual a probabilidade de cada nmero ser sorteado.

    24 Ou o limite para quando X tende ao infinito.

  • 8/12/2019 Sartoris - Estatstica e Introduo Econometria

    53/332

    51

    Se chamarmos a probabilidade do nmero 1 ser sorteado (P(1)) de uma constantedesconhecida A, temos que:

    P(2) = 2AP(3) = 3AP(4) = 4A

    P(5) = 5AOra, sabemos que a soma de todas as probabilidades, sendo os eventos mutuamente

    exclusivos,tem que ser igual a 1:

    P(1) + P(2) + P(3) + P(4) + P(5) = 1A + 2A + 3A + 4A + 5A = 115 A = 1

    A =151

    Portanto:P(1) = 1/15P(2) = 2/15P(3) = 3/15 = 1/5P(4) = 4/15P(5) = 5/15 = 1/3

    Voltando Esperana, ela uma mdia ponderada pelas probabilidades. Valem portanto, para a Esperana, as mesmas propriedades da mdia:

    E(aX +b) = aE(X) +b E(X + Y) = E(X) + E(Y)

    Podemos, inclusive, escrever a varincia em termos da Esperana. Como a varincia definida como a mdia dos quadrados dos desvios em relao mdia, temos que:

    var(X) = E[X E(X)]2

    Ou ainda, podemos calcular a varincia como sendo a mdia dos quadrados menos oquadrado da mdia, portanto:

    var(X) = E(X2) [E(X)]2

    Da mesma forma, a covarincia entre duas variveis pode ser escrita utilizando a esperana:

    cov(X,Y) = E[(X-E(X))(Y-E(Y)] = E(XY) E(X)E(Y)

    Exemplo 3.1.2Uma ao comprada por R$ 10 pode assumir, aps 30 dias, os seguintes valores: R$ 5, com probabilidade 20%; R$ 10, com probabilidade 30%; R$ 16, com probabilidade 25% e R$ 20, com probabilidade 25%. Determine o valor esperado da ao e a sua varincia.

    O valor esperado (esperana) da ao ser dado por:

  • 8/12/2019 Sartoris - Estatstica e Introduo Econometria

    54/332

    52

    E(X) = 50,2 + 100,3 + 160,25 + 200,25E(X) = 2,5 + 3 + 4 + 5 =14,5

    Como o preo da ao foi de R$ 10, o lucro mdio (esperado) desta ao R$ 4,50.

    Quanto varincia:

    E(X2) = 5

    20,2 + 10

    20,3 + 16

    20,25 + 20

    20,25E(X2) = 250,2 + 1000,3 + 2560,25 + 4000,25

    E(X2) = 12,5 + 30 + 64 + 100 = 206,5

    var(X) = E(X2) [E(X)]2 var(X) = 206,5 14,52 var(X) =210,25

    Repare que a varincia, ao medir a disperso dos possveis valores da ao, uma medida dorisco da ao.

    3.2 Algumas distribuies discretas especiais

    H distribuies que, por sua importncia, merecem um destaque especial e at um nome.Trataremos de algumas delas agora.

    3.2.1 Distribuio uniforme discreta

    A distribuio uniforme aquela em que todos os elementos tm a mesma probabilidade deocorrer. Imagine, por exemplo o marcador das horas em um relgio digital Qual a probabilidade deque, ao olhar para ele num momento qualquer do dia, ele esteja mostrando um particular nmero?Obviamente, 1/12 para qualquer nmero, considerando um mostrador de doze horas, ou 1/24 paraum mostrador de vinte e quatro horas.

    Tambm igual a probabilidade de ocorrncia de um nmero qualquer em um dado noviciado, 1/6. Tambm se trata de uma distribuio uniforme. O grfico da funo de probabilidade para o caso do dado mostrado abaixo (de novo, em forma de histograma):

    1 2 3 4 5 6

    P(X)1/6

    Exemplo 3.2.1.1Joga-se um dado uma nica vez. Qual o valor esperado do nmero obtido? E a sua varincia?

    O valor esperado (esperana) ser dado por:

  • 8/12/2019 Sartoris - Estatstica e Introduo Econometria

    55/332

  • 8/12/2019 Sartoris - Estatstica e Introduo Econometria

    56/332

    54

    E(X) = 121 + 0

    21 =

    21 = 0,5

    E a varincia:

    E(X2

    ) = 12

    21

    + 02

    21

    = 21

    = 0,5var(X) = E(X2) [E(X)]2 = 0,5 0,52 = 0,25

    Exemplo 3.2.2.2 No caso do dado, em que se aposta em um nico nmero, atribuindo o valor 1 para o sucesso e 0 para o fracasso, determine a mdia e a varincia do resultado aps uma jogada.

    A mdia ser dada por:

    E(X) = 161 + 0

    65 =

    61

    E a varincia:

    E(X2) = 1261 + 02

    65 =

    61

    var(X) = E(X2) [E(X)]2 =61

    2

    61

    =

    365

    Pelos dois exemplos acima, podemos verificar que26, numa distribuio de Bernouilli:

    E(X) = pvar(X) = p(1 p)

    Assim, podemos utilizar o resultado para o caso do candidato que tem 30% das intenes devoto. Temos que (verifique!):

    E(X) = p = 0,3var(X) = p(1 p) = 0,30,7 = 0,21

    E mesmo para o caso das peas defeituosas ou para qualquer situao que se enquadre emuma distribuio de Bernouilli.

    Especificamente no caso do candidato, possvel, como veremos adiante27, atravs davarincia, montar as chamadas margens de erro das pesquisas eleitorais.

    3.2.3 Distribuio Binomial

    26 A demonstrao dada no apndice 3.B27 No captulo 6.

  • 8/12/2019 Sartoris - Estatstica e Introduo Econometria

    57/332

    55

    A distribuio Binomial nada mais do que a generalizao da distribuio de Bernouilli.H um sucesso, com probabilidadep e um fracasso, com probabilidade 1p, mas o nmerode experimentos (de jogadas) pode ser qualquer.

    Tomemos o exemplo mais simples, que o da cara ou coroa, com trs jogadas, querepresentamos na rvore abaixo:

    3 caras

    2 caras

    1 cara 2ca 1co

    1ca 1co

    1 coroa 1ca 2co

    2 coroas

    3 coroas

    J conhecemos o resultado da primeira jogada:

    P(1 cara) = p =21

    P(1 coroa) = 1 p =21

    Para a segunda jogada, observando a rvore, verificamos que, da origem, h 4 caminhos possveis e, neste caso, todos com a mesma probabilidade. Destes 4, em 1 deles chegaramos a 2caras ou 2 coroas. Entretanto, para 1 cara e 1 coroa h 2 caminhos possveis. Portanto, para duas jogadas temos:

    P(2 caras) =41

    P(1 cara e 1 coroa) =42

    P(2 coroas) =41

    Repare que:P(2 caras) = p pP(1 cara e 1 coroa) = 2 p(1p)P(2 coroas) = (1p)(1p)

    O nmero 2 que aparece para 1 cara e 1 coroa se deve ao fato de que este resultado possvel de ocorrer de duas maneiras, isto , dando cara na primeira jogada ou dando coroa logo na primeira.

    Para 3 jogadas, h 8 caminhos possveis (verifique!). Destes 8, em apenas 1 ocorrem scaras ou s coroas. Em 3 deles ocorrem 2 caras e 1 coroa e em outros 3, 2 coroas e 1 cara.

  • 8/12/2019 Sartoris - Estatstica e Introduo Econometria

    58/332

    56

    P(3 caras) =81

    P(2 caras e 1 coroa) =83

    P(1 cara e 2 coroas) =83

    P(3 coroas) =81

    Temos agora que:P(3 caras) = p p pP(2 caras e 1 coroa) = 3 p p(1p)P(1 cara e 2 coroas) = 3 p(1p)(1p)P(3 coroas) = (1p)(1p)(1p)

    E agora aparece o nmero 3 para 2 caras e 1 coroa (ou 1 cara e 2 coroas). De onde? Bom, hrealmente 3 possibilidades: 1a cara, 2a cara e 3a coroa; ou, 1a cara, 2a coroa e 3a cara; ou ainda, 1a coroa, 2a cara, 3a cara. Podemoscombinar as posies das 2 caras de 3 maneiras diferentes. Onmero 3, na verdade, a quantidade decombinaes28 de 3 elementos em grupos de 2.

    Portanto:P(3 caras) = C3,3 p p pP(2 caras e 1 coroa) = C3,2 p p(1p)P(1 cara e 2 coroas) = C3,1 p(1p)(1p)P(3 coroas) = C3,0(1p)(1p)(1p)

    Nota: as combinaes de n elementos em grupos de k tambm podem ser escritas como:

    Cn,k = k

    n

    Que se lbinomial de n, k (por razes que agora so bvias). Portanto, as probabilidades para 3 jogadas podem ser escritas assim:

    P(3 caras) = 33 p p p

    P(2 caras e 1 coroa) = 23 p p(1p)

    P(1 cara e 2 coroas) = 13

    p(1p)(1p)

    P(3 coroas) = 03 (1p)(1p)(1p)

    Podemos generalizar, para um experimento qualquer, onde a probabilidade de sucesso pe a probabilidade de fracasso 1p, a probabilidade de que, em n jogadas, ocorram k sucessos :

    28 Veja apndice 1.A.

  • 8/12/2019 Sartoris - Estatstica e Introduo Econometria

    59/332

    57

    P( x = k) = k n

    pk (1p)n-k

    Exemplo 3.2.3.1Suponha um jogo de dados em que se aposta em um nico nmero. Determine a probabilidade de:a) em 3 jogadas, ganhar 2

    uma distribuio binomial onde p = 1/6, temos 3 jogadas e o sucesso ocorre em 2 delas:

    P( x = 2) = 23

    2

    61

    1

    65

    P( x = 2) = 3361

    65

    P( x = 2) =21615

    b) em 4 jogadas, ganhar 2.

    P( x = 2) = 24

    2

    61

    2

    65

    P( x = 2) = 6361

    3625

    P( x = 2) =1296150

    c) em 5 jogadas, ganhar 3.

    P( x = 3) = 35

    3

    61

    2

    65

    P( x = 3) = 102161

    3625

    P( x = 3) =7776250

    Exemplo 3.2.3.2Calcule a mdia e a varincia no jogo de cara ou coroa, atribuindo valor 1 para cara e 0 para coroa,considerando 1, 2 e 3 jogadas.

    Para 1 jogada, ficamos reduzidos ao caso particular da distribuio de Bernouilli, cujoresultado j conhecemos:

    E( x) = p =21

    var( x) = p(1p) =41

    Faamos ento, o clculo para 2 e 3 jogadas. Para 2 jogadas, temos:

  • 8/12/2019 Sartoris - Estatstica e Introduo Econometria

    60/332

    58

    E( x) = 241 + 1

    42 + 0

    41 =

    44 = 1

    E( x2) = 2241 + 12

    42 + 02

    41 =

    46 = 1,5

    var( x) = 1,5 12 = 0,5

    E, para 3 jogadas, temos:

    E( x) = 381 + 2

    83 + 1

    83 + 0

    81 =

    812 = 1,5

    E( x2) = 3281 + 22

    83 + 12

    83 + 02

    81 =

    824 = 3

    var( x) = 3 1,52 = 0,75

    Note que vlido que:

    E( x) = npvar( x) = np(1p)

    3.2.4. Distribuio Geomtrica

    A distribuio geomtrica tambm se refere a sucessos e fracassos mas, diferente da binomial a probabilidade de que o sucesso ocorra (exatamente) na k-sima jogada. Por exemplo,na cara ou coroa, qual a probabilidade de que a cara s ocorra na terceira jogada? Ou, qual a probabilidade de que o dado s d o nmero desejado na quarta jogada.

    Assim sendo, a forma geral da distribuio geomtrica ser dada por:

    P( x = k) = (1p)k-1 p

    Ou seja, uma seqncia de fracassos nas k-1 primeiras jogadas, culminando comsucesso apenas na k-sima jogada.

    Exemplo 3.2.4.1Um time de basquete no est muito bem nesta temporada, de tal forma que a probabilidade de queganhe um jogo qualquer 20%. Qual a probabilidade de que a primeira vitria ocorra:a) na primeira partida?

    A imediato:P( x = 1) = 0,2 = 20%

    b) na segunda partida?

    P( x = 2) = 0,80,2 = 0,16 = 16%

    c) na quinta partida?

    P( x = 5) = 0,840,2 = 0,08192 8,2%

    Exemplo 3.2.4.2Qual a partida esperada em que ocorrer a primeira vitria?

  • 8/12/2019 Sartoris - Estatstica e Introduo Econometria

    61/332

    59 O valor esperado da k-sima partida em que ocorrer a to sonhada vitria :

    E( x) = 10,2 + 20,80,2 + 30,820,2 + 40,830,2 + ...E( x) = 0,2[1 + 20,8 + 30,82 + 40,83 + ...]

    A expresso entre colchetes quase uma progresso geomtrica, exceto pelos nmeros 1, 2,3, 4, etc. Na verdade, uma soma de progresses geomtricas como podemos ver abaixo:

    1 + 0,8 + 0,82 + 0,83 + ...0,8 + 0,82 + 0,83 + ...

    0,82 + 0,83 + ...0,83 + ...

    1 + 20,8 + 30,82 + 40,83 + ...

    Relembrando que a soma de uma progresso geomtrica infinita cujo primeiro termo a cuja razo (q) menor do que 1, em mdulo, dada por 29:

    S =

    q1

    a

    Temos ento que:

    E( x) = 0,2(8,01

    1

    +8,01

    8,0 2

    +

    8,018,0 3

    + ...)

    E( x) =8,01

    2,0

    ( 1 + 0,8 + 0,82 + 0,83 + ...)

    O termo entre parnteses tambm uma progresso geomtrica, enquanto o termomultiplicando exatamente 1:

    E( x) =8,01

    1

    =2,0

    1 = 5

    Portanto, o esperado que a vitria ocorra na quinta partida.

    Repare que o resultado obtido pode ser generalizado para:

    E( x) = p1

    Que a mdia de uma distribuio geomtrica.3.2.5 Distribuio Hipergeomtrica

    A distribuio Hipergeomtrica se refere a probabilidade de ao retirarmos,sem reposio, nelementos em um conjunto de N, k elementos com o atributo sucesso, sendo que, do total de Nelementos, s possuem este atributo e, portanto, N s possuem o atributo fracasso. Fica claro que,da maneira como definimos p anteriormente:

    29 O que mostrado no apndice 3.A

  • 8/12/2019 Sartoris - Estatstica e Introduo Econometria

    62/332

    60

    p = Ns

    A pergunta aqui, ento, : qual a probabilidade de que, retirando-se n elementos, k possuamo atributo sucesso e n-k o atributo fracasso.

    Do total de N elementos, podemos tirar

    n

    N grupos de n elementos. Dos s que possuem o

    atributo sucesso, h k s

    grupos de k elementos que poderiam sair nesta extrao. Finalmente,

    dos N-r que possuem o atributo fracasso, h

    k -ns- N

    grupos de n-k elementos. Ento, a

    probabilidade de encontrarmos k elementos com o atributo sucesso :

    P( x = k) =

    n N k -n

    s- N

    k

    s

    Exemplo 3.2.5.1Sabe-se que h 10% de peas defeituosas em um lote de 50. Ao retirar 8 peas deste lote,semreposio, qual a probabilidade de que 2 delas sejam defeituosas?

    Como so 10% de peas defeituosas em um total de 50, h 5 peas defeituosas. Pede-se a probabilidade de retirar 2 (do total de 5) peas defeituosas e 6 (de um total de 45) peas em bomestado.

    Esta probabilidade calculada como se segue:

    P( x = 2) =

    850

    645

    25

    0,1517 = 15,17%

    3.2.6 Distribuio de Poisson

    Voc capaz de dizer quantas vezes, em mdia, toca o telefone por dia na sua casa ou noseu escritrio? Provavelmente, sim. Mas quantas vezesno toca o telefone? Esta pergunta muitodifcil de se responder. Quando uma varivel aleatria tem um comportamento parecido com este,dizemos que ela segue uma distribuio dePoisson.

    Se considerarmos que sucesso tocar o telefone, muito difcil calcular op, a probabilidade disso ocorrer, j que no temos como calcular a no ocorrncia do evento.

    A soluo imaginar que op muito pequeno, j que o toque do telefone dura apenasalguns segundos em um dia de 24 horas. Portanto, o nmero de vezes que este experimento realizado (telefone toca ou no toca), que