apostila ProbabilidadeeEstatistica

Embed Size (px)

Citation preview

  • UNIVERSIDADE DE CAXIAS DO SUL

    PROFESSORA: CNTIA PAESE GIACOMELLO

    Probabilidade e Estatstica

  • Prof. Cntia Paese Giacomello 2

    ndice

    1 Introduo _____________________________________________________1

    1.1 Amostragem ________________________________________________________ 2

    1.2 Tipos de variveis ____________________________________________________ 4

    2 Sries estatsticas _______________________________________________5 3 Grficos _______________________________________________________6 4 Distribuies de freqncias______________________________________12

    4.1 Construo de distribuio de freqncia para dados contnuos ______________ 12

    4.2 Grficos das distribuies de freqncia _________________________________ 13

    4.3 Construo de distribuio de freqncia para dados discretos ______________ 15

    4.4 Construo de uma distribuio de freqncia acumulada___________________ 17

    4.5 Distribuies de freqncia para dados nominais e por postos _______________ 18

    4.6 Grficos para distribuies de freqncia ________________________________ 19

    5 Medidas de tendncia central _____________________________________20

    5.1 Mdia_____________________________________________________________ 20

    5.2 Mediana ___________________________________________________________ 23

    5.3 Moda _____________________________________________________________ 25

    5.4 Relao entre as medidas de tendncia central ___________________________ 26

    6 Medidas de variabilidade ________________________________________28

    6.1 Amplitude _________________________________________________________ 28

    6.2 Varincia __________________________________________________________ 29

    6.3 Desvio padro ______________________________________________________ 29

    6.4 Coeficiente de variao ______________________________________________ 30

    7 Medidas de assimetria e curtose __________________________________31 8 Introduo probabilidade_______________________________________33

    8.1 Experimento aleatrio _______________________________________________ 33

    8.2 Espao amostral ____________________________________________________ 34

    8.3 Eventos ___________________________________________________________ 34

    8.4 A probabilidade de um evento _________________________________________ 34

    8.5 Clculo das probabilidades ____________________________________________ 37

    9 Distribuies de probabilidade ____________________________________43 10 Teoria elementar da amostragem ________________________________56

    10.1 Amostragem com e sem reposio ____________________________________ 56

    10.2 Distribuies amostrais _____________________________________________ 56

  • Prof. Cntia Paese Giacomello 3

    11 Estimao ___________________________________________________62 12 Testes de hipteses ___________________________________________68

    12.1 Teste de hipteses para mdias ______________________________________ 70

    12.2 Testes de duas amostras para mdias _________________________________ 72

    12.3 Teste para propores _____________________________________________ 72

    12.4 Teste do qui-quadrado (k amostras para propores) ____________________ 73

    13 Anlise de varincia (ANOVA - Analysis of Variance) _________________79

    13.1 Formulrio para soluo ____________________________________________ 83

    13.2 Exemplo de soluo no Excel ________________________________________ 85

    14 Regresso e correlao ________________________________________90

    Regresso ______________________________________________________________ 91

    14.1 Aplicaes da regresso ____________________________________________ 91

    14.2 Classificao das regresses_________________________________________ 91

    14.3 Modelo linear _____________________________________________________ 91

    Correlao ______________________________________________________________ 94

    14.4 Objetivo da correlao _____________________________________________ 94

    14.5 O coeficiente r de Pearson (correlao)________________________________ 94

    14.6 Coeficiente de determinao ________________________________________ 94

    14.7 Exemplo de soluo no Excel ________________________________________ 96

    14.8 Outros modelos __________________________________________________ 100

    15 Tabelas ____________________________________________________106

  • Prof. Cntia Paese Giacomello 1

    11 IInnttrroodduuoo

    Estuda-se estatstica para aplicar seus conceitos como auxlio nas tomadas de deciso diante de incertezas, justificando cientificamente as decises.

    Os princpios estatsticos so utilizados em uma grande variedade de situaes no governo, nos negcios e na indstria, bem como no mbito das cincias sociais, biolgicas e fsicas.

    Estatstica a cincia ou mtodo cientfico que estuda os fenmenos multicausais, coletivos ou de massa e procura inferir as leis que os mesmos obedecem.

    Mtodo estatstico um processo para se obter, apresentar e analisar caractersticas ou valores numricos para uma melhor tomada de deciso em situaes de incerteza. Os passos da metodologia estatstica so os seguintes:

    Definio cuidadosa do problema

    Formulao de um plano para coleta das unidades de observao

    Coleta, resumo e apresentao das unidades de observao ou de seus valores numricos

    Anlise dos resultados

    Divulgao de relatrio com as concluses, de tal modo que estas sejam facilmente entendidas por quem as for usar na tomada de decises.

    Em geral, aceita a diviso da estatstica em dois grandes grupos: estatstica descritiva e indutiva.

    Descritiva: corresponde aos procedimentos relacionados com a coleta, elaborao, tabulao, anlise, interpretao e apresentao dos dados. Isto , inclui as tcnicas que dizem respeito sintetizao e descrio de dados numricos. Tais mtodos podem ser grficos e envolvem a utilizao de recursos computacionais. O objetivo da estatstica descritiva tornar as coisas mais fceis de entender, relatar e discutir.

    Indutiva (ou inferencial): parte de uma ou mais amostras (subconjuntos da populao) e conclui sobre a populao. Utiliza tcnicas como a teoria das probabilidades, inferncia estatstica, amostragem.

    Com maior freqncia utilizamos o estudo da amostra do que da populao, no s por serem menos dispendiosas e consumirem menos tempo no processamento dos dados, mas tambm porque muitas vezes no dispomos de todos os elementos da populao.

  • Prof. Cntia Paese Giacomello 2

    Definies:

    Populao: coleo completa de todos os elementos (valores, pessoas, medidas,...) a serem estudados.

    Amostra: subcoleo de elementos extrados da populao.

    Censo: coleo de dados relativos a todos os elementos de uma populao.

    Amostragem: coleo de dados relativos a elementos de uma amostra.

    Exemplo: Populao Amostra

    Parmetro: medida numrica que descreve uma caracterstica de uma populao

    Estatstica: medida numrica que descreve uma caracterstica de uma amostra

    1.1 Amostragem O objetivo da amostragem permitir fazer inferncias sobre uma populao aps inspeo de apenas parte dela. Fatores como custo, tempo, ensaios destrutivos e populaes infinitas tornam a amostragem prefervel a um estudo completo (censo).

    Os principais tipos de amostragem utilizados so os probabilsticos, onde todos os indivduos da populao tm a mesma chance de serem selecionados. Os planos de amostragem probabilstica so delineados de tal modo que se conhece todas as combinaes amostrais possveis e suas probabilidades, podendo-se ento determinar o erro amostral.

    Os mtodos mais comuns de amostragem probabilstica so:

    Amostragem aleatria simples: os elementos de uma populao so escolhidos de tal forma que todos tenham a mesma chance de serem escolhidos. Pode-se utilizar uma tabela de nmeros aleatrios ou um programa de gerao de nmeros aleatrios.

    Amostragem estratificada: subdivide-se a populao em, no mnimo, dois estratos (subpopulaes) que compartilham a mesma caracterstica e em seguida escolhe-se uma amostra de cada. Exemplo: homens e mulheres.

    Amostragem sistemtica: escolhe-se um ponto de partida e ento, sistematicamente, selecionam-se os outros. Por exemplo: o 3, 403, 803, 1203,... indivduos

  • Prof. Cntia Paese Giacomello 3

    Amostragem por conglomerados: divide-se a populao em conglomerados (reas), em seguida sorteiam-se algumas reas e analisam-se todos os elementos dos conglomerados escolhidos. Por exemplo: bairros.

    Fonte: Triola, Mrio. 1999, 11.

    Amostragens no probabilsticas so utilizadas quando a populao em estudo muito pequena ou de difcil obteno. Neste caso a anlise de uma amostra poderia causar distores. Uma pessoa familiarizada com a populao pode indicar melhor as unidades amostrais. Este tipo de amostragem no permite avaliar o erro amostral. EX: doena rara.

  • Prof. Cntia Paese Giacomello 4

    1.2 Tipos de variveis Alguns conjuntos de dados consistem em nmeros, enquanto outros so no numricos. Utiliza-se a nomenclatura de dados (ou variveis) qualitativos e quantitativos.

    Exerccios:

    Identifique cada nmero como discreto ou contnuo

    1. Cada cigarro Camel tem 16,13 mg de alcatro

    2. O altmetro de um avio da American Airlines indica uma altitude de 21.359 ps

    3. Uma pesquisa efetuada com 1015 pessoas indica que 40 delas so assinante de um servio de informao on-line.

    4. O tempo total gasto anualmente por um motorista de txi de Nova York ao dar passagem a pedestres de 2367 segundos.

    Apresente dois exemplos de dados discretos ou contnuos de sua empresa / pesquisa.

    Quantitativas Qualitativas

    Discretas Contnuas

    Variveis

  • Prof. Cntia Paese Giacomello 5

    22 SSrriieess eessttaattssttiiccaass

    Consiste no agrupamento dos dados estatsticos em tabelas.

    Em qualquer srie estatstica so observados trs elementos fundamentais:

    O fato, isto , o que est sendo observado

    O espao geogrfico

    A poca

    Estes elementos criam classificaes para as sries: especficas, temporais ou geogrficas.

    Sries temporais (ou histricas)

    Os dados esto reunidos de acordo com o tempo, que varia. Os outros dois fatores - local e fato - permanecem inalterados.

    Sries geogrficas

    Os dados esto reunidos de acordo com o local, que varia. Os outros dois fatores - fato e data - permanecem inalterados.

  • Prof. Cntia Paese Giacomello 6

    Sries especficas

    Os dados esto reunidos de acordo com o evento, que varia. Os outros dois fatores - local e data - permanecem inalterados.

    As sries podem ainda apresentar-se sob a forma mista, resultante da combinao dos fatores.

    33 GGrrffiiccooss

    Os grficos consistem em uma forma de apresentao dos dados, usualmente utilizada pois facilita a interpretao dos resultados.

    So elementos complementares de um grfico:

    Ttulo geral, poca e local

    Escalas e respectivas unidades de medida

    Indicao das convenes adotadas (legenda)

    Fonte de informao dos dados

  • Prof. Cntia Paese Giacomello 7

    Principais tipos de grficos: (Fonte: Site da Microsoft www.microsoft.com.br)

    Colunas Um grfico de colunas mostra as alteraes de dados em um perodo de tempo ou ilustra comparaes entre itens. As categorias so organizadas na horizontal e os valores so distribudos na vertical, para enfatizar as variaes ao longo do tempo.

    Grficos de colunas empilhadas mostram o relacionamento de itens individuais com o todo

    . O grfico de colunas em perspectiva 3D compara pontos de dados ao longo dos dois eixos.

    Nesse grfico 3D, voc pode comparar o desempenho das vendas de quatro trimestres na Europa com o desempenho de outras duas divises.

    Vendas por local

    Barras

    Um grfico de barras ilustra comparaes entre itens individuais. As categorias so organizadas na vertical e os valores na horizontal para enfocar valores de comparao.

    Grficos de barras empilhadas mostram o relacionamento de itens individuais com o todo.

    Vendas por produto

  • Prof. Cntia Paese Giacomello 8

    Linha Um grfico de linhas mostra tendncias nos dados em intervalos iguais.

    A unio dos pontos faz sentido pois a varivel contnua. Meses usualmente so tratados como variveis contnuas

    Valor de venda do produto X

    Pizza

    Um grfico de pizza mostra o tamanho proporcional de itens que constituem uma srie de dados para a soma dos itens. Ele sempre mostra somente uma nica srie de dados, sendo til quando voc deseja dar nfase a um elemento importante.

    Totaliza a informao (100%). Cada faixa do grfico proporcional informao.

    Para facilitar a visualizao de fatias pequenas, voc pode agrup-las em um nico item do grfico de pizza e subdividir esse item em um grfico de pizza ou de barras menor, ao lado do grfico principal.

    Diagrama de Disperso (Disperso XY) Um grfico xy (disperso) mostra a relao existente entre os valores numricos em vrias sries de dados ou plota dois grupos de nmeros como uma srie de coordenadas xy. Esse grfico mostra intervalos irregulares ou clusters de dados e usado geralmente para dados cientficos.

    Relao entre tempo e temperatura

  • Prof. Cntia Paese Giacomello 9

    Histograma

    um grfico de colunas, porm utilizado para apresentar distribuies de freqncias.

    Apresenta as classes ao longo do eixo horizontal e as freqncias (absolutas ou relativas) ao longo do eixo vertical. As fronteiras das barras coincidem com os pontos extremos dos intervalos de classe.

    Distribuio da quantidade produzida

    0.000.050.100.150.200.250.30

    3 a 8 8 a 13 13 a 18 18 a 23 23 a 28 28 a 33

    Safras (alq.)

    % da

    s r

    vo

    res

    rea Um grfico de rea enfatiza a dimenso das mudanas ao longo do tempo. Exibindo a soma dos valores plotados, o grfico de rea mostra tambm o relacionamento das partes com um todo.

    Nesse exemplo, o grfico de rea enfatiza o aumento das vendas em Washington e ilustra a contribuio de cada estado para o total das vendas.

    Superfcie Um grfico de superfcie til quando voc deseja localizar combinaes vantajosas entre dois conjuntos de dados. Como em um mapa topogrfico, as cores e os padres indicam reas que esto no mesmo intervalo de valores.

    Esse grfico mostra as vrias combinaes de temperatura e tempo que resultam na mesma medida de resistncia trao.

  • Prof. Cntia Paese Giacomello 10

    Radar Um grfico de radar compara os valores agregados de vrias sries de dados.

    Nesse grfico, a srie de dados que cobre a maior parte da rea, Marca A, representa a marca com o maior contedo de vitamina.

    Aes

    O grfico de alta-baixa-fechamento usado muitas vezes para ilustrar preos de aes. Esse grfico tambm pode ser usado com dados cientficos para, por exemplo, indicar mudanas de temperatura. Voc deve organizar seus dados na ordem correta para criar esse e outros grficos de aes.

    Um grfico de aes que mede o volume tem dois eixos de valores: um para as colunas, que medem o volume, e outro para os preos das aes. Voc pode incluir volume em um grfico de alta-baixa-fechamento ou de abertura-alta-baixa-fechamento.

  • Prof. Cntia Paese Giacomello 11

    Bolhas Um grfico de bolhas um tipo de grfico xy (disperso). O tamanho do marcador de dados indica o valor de uma terceira varivel.

    Para organizar seus dados, coloque os valores de x em uma linha ou coluna e insira os valores de y e os tamanhos das bolhas correspondentes nas linhas ou colunas adjacentes.

    O grfico nesse exemplo mostra que a Empresa A tem a maioria dos produtos e a maior fatia do mercado, mas no necessariamente as melhores vendas.

    Cone, cilindro e pirmide Os marcadores de dados em forma de cone, cilindro e pirmide podem dar um efeito especial aos grficos de colunas e de barras 3D.

    Rosca

    Como um grfico de pizza, o grfico de rosca mostra o relacionamento das partes com o todo, mas pode conter mais de uma srie de dados. Cada anel do grfico de rosca representa uma srie de dados.

  • Prof. Cntia Paese Giacomello 12

    44 DDiissttrriibbuuiieess ddee ffrreeqqnncciiaass

    Distribuio de freqncia uma tabela resumida na qual os dados so organizados em grupos de classe ou categorias convenientemente estabelecidas e numericamente ordenadas.

    As distribuies de freqncias so series hetergrafas, isto , sries na qual o fenmeno ou fato apresenta graduaes ou subdivises. Embora fixo, o fenmeno varia de intensidade.

    Nas distribuies de freqncia, os dados so agrupados segundo um critrio de magnitude, em classe ou pontos, permanecendo constante o fato, local e tempo, de tal forma que se possa determinar a percentagem ou nmero, de cada classe. um tipo de apresentao que condensa uma coleo de dados conforme as freqncias ou repeties de seus valores.

    A construo da distribuio de freqncia depende do tipo de dado com os quais se est lidando: contnuos ou discretos.

    4.1 Construo de distribuio de freqncia para dados contnuos Os principais estgios so:

    1. Estabelecer a quantidade de classes ou intervalos de grupamento dos dados. O

    nmero de classes deve variar entre 5 e 15. Aconselha-se utilizar n onde n o nmero de observaes.

    2. Determinar a amplitude das classes. Aconselha-se fazer amplitude / no de classes. (OBS: amplitude = maior valor menor valor)

    3. Enquadrar os dados nas classes, mediante contagem e apresentar os resultados em uma tabela ou grfico

    Exemplo: Os dados a seguir representam o tempo (em minutos) que 45 operadores de mquina demoraram para fazer o setup de uma mquina.

    6,5 4,0 7,1 8,3 5,4 7,6 9,0 15,7 16,7 6,4 5,0 8,5 5,7 7,7 7,2 12,4 7,1 5,5 9,7 4,4 7,0 6,3 8,3 6,9 5,7 7,6 7,9 7,9 6,0 8,2 10,4 9,9 3,9 9,8 8,2 5,6 7,9 6,4 7,4 7,0 13,0 8,7 6,4 6,7 7,4

    1 Nmero de classes 45 valores 45 =6,7 7 classes

    2 Amplitude das classes 16,7 3,9 = 12,8 (Maior valor = 16,7; Menor valor = 3,9). Logo, tem-se a amplitude das classes 12,8 / 7 = 1,83 2

  • Prof. Cntia Paese Giacomello 13

    3 Escrever as classes e contar os valores

    Tempo (minutos)

    Nmero de operadores

    % de operadores

    3 | 5 4 8,9%

    5 | 7 15 33,3%

    7 | 9 18 40,0%

    9 | 11 4 8,9%

    11 | 13 2 4,4%

    13 | 15 0 0,0%

    15 | 17 2 4,4%

    Total 45 100%

    3 | 5 equivale a 3 < x 5 Ou seja, so contados no intervalo todos os valores

    superiores a 3 e inferiores ou iguais a 5.

    A freqncia absoluta (fi) corresponde ao nmero de operadores

    A freqncia relativa (fri) corresponde ao percentual de operadores

    4.2 Grficos das distribuies de freqncia Histograma de freqncias

    Anlise dos tempos para fazer o setup da mquina

    4

    15

    18

    42

    02

    02468

    101214161820

    3 | 5 5 | 7 7 | 9 9 | 11 11 | 13 13 | 15 15 | 17Tempo (minutos)

    Nm

    ero

    de

    op

    erado

    res

    Uma alternativa ao histograma de freqncias o polgono de freqncias, construdo mediante a conexo dos pontos mdios dos intervalos do histograma, com linhas retas.

  • Prof. Cntia Paese Giacomello 14

    Anlise dos tempos para fazer o setup da mquina

    4

    15

    18

    42

    02

    02468

    101214161820

    3 | 5 5 | 7 7 | 9 9 | 11 11 | 13 13 | 15 15 | 17Tempo (minutos)

    Nm

    ero

    de op

    erad

    ores

    OBS: uma vez que a rea do polgono deve ser 100%, deve-se ligar o primeiro e o ltimo pontos mdios com o eixo horizontal, de modo a cercar a rea da distribuio observada.

    Exerccios:

    1. A tabela de dados representa o peso de 30 sacos de arroz da marca A selecionados aleatoriamente em um supermercado. Construa a distribuio de freqncias e apresente em um grfico. (para facilitar os dados j esto ordenados)

    922 930 936 950 954 954 958 965 968 974

    977 979 987 989 1001 1006 1008 1010 1013 1017

    1018 1034 1034 1035 1042 1044 1044 1048 1070 1116

    2. Construa a distribuio de freqncia e o polgono de freqncias.

    6,2 9,0 12,2 14,7 7,9 9,8 8,0 13,3 13,3 8,9

    8,8 8,3 11,8 11,8 14,7 8,5 7,7 11,4 11,2 10,6

  • Prof. Cntia Paese Giacomello 15

    4.3 Construo de distribuio de freqncia para dados discretos Na construo de uma distribuio de freqncia utilizando dados contnuos, perde-se certa quantidade de informao porque os valores individuais perdem sua identidade quando so agrupados em classes. Isso pode ou no ocorrer com dados discretos, dependendo da natureza dos dados e os objetivos do analista.

    Consideremos os seguintes dados relativos ao nmero de acidentes dirios em um grande estacionamento, durante o perodo de 50 dias.

    1 6 3 6 2 4 5 3 7 9

    5 4 5 3 4 5 6 0 8 4

    4 1 9 5 7 5 5 4 5 8

    4 5 3 2 6 7 4 3 1 4

    0 0 5 4 2 6 6 2 8 7

    Note que os dados esto entre 0 e 9.

    Podemos construir uma distribuio de freqncia sem perda dos valores originais, utilizando os prprios valores.

    Classe Freqncia dias % dos dias

    0 3 0,06 1 3 0,06 2 4 0,08 3 5 0,10 4 10 0,20 5 10 0,20 6 6 0,12 7 4 0,08 8 3 0,06 9 2 0,04 50 1,00

    0

    2

    4

    6

    8

    10

    12

    0 1 2 3 4 5 6 7 8 9

    Nm

    ero

    de di

    as

    No houve perda de informao, ou seja, poderamos construir a tabela original a partir da distribuio de freqncias.

  • Prof. Cntia Paese Giacomello 16

    Por outro lado, poderamos usar como classes 0-1, 2-3, 4-5, 6-7 e 8-9.

    Classe Freqncia

    dias % dos dias

    0-1 6 0,12

    2-3 9 0,18

    4-5 20 0,40

    6-7 10 0,20

    8-9 5 0,10

    50 1,00

    0

    5

    10

    15

    20

    25

    0-1 2-3 4-5 6-7 8-9

    Nm

    ero de

    dia

    s

    De modo geral prefere-se uma distribuio de freqncia sem perda de informao quando:

    Os dados so constitudos de valores inteiros.

    H menos de, digamos, 16 classes.

    H suficientes observaes para originar uma distribuio significativa

    Por outro lado, prefere-se uma distribuio de freqncia com perda da informao quando:

    Esto em jogo inteiros e no inteiros

    S existem inteiros, porm em nmero muito alto para permitir uma distribuio til.

    A perda da informao de importncia secundria (por exemplo, o arredondamento do peso de um caminho ou da renda anual para a unidade mais prxima)

  • Prof. Cntia Paese Giacomello 17

    4.4 Construo de uma distribuio de freqncia acumulada Uma distribuio de freqncia acumulada tem por objetivo indicar o nmero ou percentual de itens menores do que, ou iguais a, determinado valor.

    No caso dos acidentes podemos construir distribuies acumuladas para a distribuio com e sem perda da informao.

    Sem perda da informao

    Classe N dias % dias Freqncias acumuladas

    0 3 0,06 0,06 1 3 0,06 0,12 2 4 0,08 0,20 3 5 0,10 0,30 4 10 0,20 0,50 5 10 0,20 0,70 6 6 0,12 0,82 7 4 0,08 0,90 8 3 0,06 0,96 9 2 0,04 1,00 50 1,00

    Com perda da informao

    Classe N dias % dias Freqncias acumuladas

    0-1 6 0,12 0,12

    2-3 9 0,18 0,30

    4-5 20 0,40 0,70

    6-7 10 0,20 0,90

    8-9 5 0,10 1,00

    50 1,00

    Podemos, pela primeira tabela, concluir que 90% dos dados correspondem a valores menores ou iguais a 7. ou seja, Em 90% dos dias o nmero de acidentes no excede 7.

  • Prof. Cntia Paese Giacomello 18

    0.0

    0.2

    0.4

    0.6

    0.8

    1.0

    0 1 2 3 4 5 6 7 8 90.0

    0.2

    0.4

    0.6

    0.8

    1.0

    0-1 2-3 4-5 6-7 8-9

    Os polgonos de freqncias acumuladas so tambm chamados de ogivas.

    0,0

    0,2

    0,4

    0,6

    0,8

    1,0

    0 1 2 3 4 5 6 7 8 9

    N. acidentes

    % dos dias

    4.5 Distribuies de freqncia para dados nominais e por postos As distribuies de freqncias para dados nominais se assemelham s distribuies de freqncia normais, porm apresentam as categorias em lugar das classes.

    Por exemplo:

    Vendas absolutas

    Vendas relativas

    Limo 600 0,375

    Laranja 400 0,250

    Melo 300 0,188

    Melancia 200 0,125

    Abacaxi 100 0,063

    Total 1600 1,000

    Usa-se o grfico de barras ou colunas para representar dados nominais.

  • Prof. Cntia Paese Giacomello 19

    4.6 Grficos para distribuies de freqncia A distribuio de freqncia muitas vezes utilizada para determinar o formato da distribuio. A distribuio dos dados pode ser simtrica ou no.

    Exerccio:

    Construa a distribuio de freqncia e desenhe o histograma dos dados a seguir. Qual o formato da distribuio?

    20,7 18,7 26,2 21,7 18,8 20,6 20,7 20,2 18,5 21,3 19,3 18,3 25,1 18,8 24,3 28,4 23,3 25,3 20,4 18,3 24,0 21,2 19,4 20,6 18,9 26,6 22,4 18,9 22,6 21,4 27,0 23,6 28,3 20,3 21,7 18,2 20,3 19,2 24,7 18,4

    Distribuies discretas

    Simtrica Assimtrica esquerda Assimtrica direita

  • Prof. Cntia Paese Giacomello 20

    55 MMeeddiiddaass ddee tteennddnncciiaa cceennttrraall

    As medidas de tendncia central so usadas para indicar um valor que tende a representar melhor um conjunto de nmeros. As trs medidas mais usadas so a mdia, a mediana e a moda.

    5.1 Mdia

    5.1.1 Mdia aritmtica

    A mdia aritmtica o resultado da diviso da soma de todos os valores da amostra pela quantidade total de valores.

    OBS: x l-se X barra e significa mdia. =

    n

    iix

    1 l-se somatrio de x i, i variando de 1 a n.

    =

    +++=n

    ini x...xxx

    121

    Se um estudante faz quatro provas, obtendo as notas 70, 60, 80 e 75, sua mdia : 71,25.

    Algumas propriedades da mdia

    A mdia de um conjunto de dados pode ser sempre calculada.

    Para um dado conjunto de nmeros, a mdia nica.

    A mdia sensvel a (ou afetada por) todos os valores do conjunto, assim, se um nmero se modifica, a mdia tambm se modifica.

    Somando-se uma constante a cada valor do conjunto, a mdia ficar aumentada do valor constante. Analogamente, extraindo-se um valor constante de cada valor do conjunto, a mdia tambm ficar diminuda desse valor.

    A soma dos desvios dos nmeros de um conjunto a contar da mdia zero.

    n

    x

    x

    n

    ii

    =

    =1 ou simplesmente

    n

    xx

    =

  • Prof. Cntia Paese Giacomello 21

    5.1.2 Mdia ponderada

    A frmula anterior para calcular a mdia aritmtica supe que cada observao tenha a mesma importncia. A mdia ponderada considera que as informaes no tem a mesma importncia, ou seja, devem ser levados em conta o peso das informaes.

    Onde wi o peso da observao de ordem i.

    Consideremos que um professor informe a classe de que haver dois exames parciais, valendo cada um 30% da nota e um exame final valendo 40%. Um aluno obtm desempenho 70 na primeira avaliao, 65 na segunda e 80 no exame final.

    Mdia ponderada = 5072001

    400803006530070

    1

    1 ,,

    ,x,x,x

    w

    xw

    n

    ii

    n

    iii

    =

    ++=

    =

    =

    5.1.3 Mdia geomtrica

    A mdia geomtrica utilizada quando se deseja fazer a mdia de taxas de juro, por exemplo. Neste caso, multiplicam-se os n termos e em seguida extra-se a raiz de ordem n.

    A mdia geomtrica o resultado da raiz de ordem n do produto de todos os valores da amostra.

    OBS: nn

    ii x...xxxx 321

    1=

    =

    l-se produtrio de x i, i variando de 1 a n.

    5.1.4 Mdia harmnica

    A mdia harmnica de um conjunto de n nmeros a recproca da mdia aritmtica dos recprocos dos nmeros.

    Mdia geomtrica = nn

    iix

    =1

    Mdia ponderada =

    =

    =

    n

    ii

    n

    iii

    w

    xw

    1

    1

  • Prof. Cntia Paese Giacomello 22

    5.1.5 Relao entre as mdias aritmtica, geomtrica e harmnica

    A mdia geomtrica de um conjunto de nmeros positivos menor ou igual sua mdia aritmtica, mas maior ou igual sua mdia harmnica.

    Em smbolos: xGH

    O sinal de igualdade vale somente quando todos os nmeros forem iguais.

    Exemplo: o conjunto 2,4 e 8 tem mdia aritmtica 4,67, mdia geomtrica 4 e mdia harmnica 3,43.

    5.1.6 Clculo da mdia para uma distribuio de freqncia

    A mdia de uma distribuio de freqncia calculada com base valor e na freqncia de cada classe.

    n

    xfx ii=

    Onde fi a freqncia da classe i.

    Para dados com perda da informao, utiliza-se em lugar de x i o ponto mdio do intervalo.

    Exemplo:

    Classe Ponto mdio (x i) N dias (f i) f i xi

    0-1 0,5 6 3,0

    2-3 2,5 9 22,5

    4-5 4,5 20 90,0

    6-7 6,5 10 65,0

    8-9 8,5 5 42,5

    n = 50 223

    46450223

    ,n

    xfx ii ===

    Mdia harmnica =

    =

    x

    n

    xn

    n

    i i

    1111

    1

  • Prof. Cntia Paese Giacomello 23

    Classe (x i) N dias (f i) f i xi 0 3 0 1 3 3 2 4 8 3 5 15 4 10 40 5 10 50 6 6 36 7 4 28 8 3 24 9 2 18 50 222

    44450222

    ,n

    xfx ii ===

    Se fizssemos a mdia a partir da tabela original obteramos o valor de 4,44.

    5.2 Mediana A principal caracterstica da mediana dividir o conjunto de nmeros em dois grupos iguais: a metade ter valores inferiores ou iguais mediana e a metade ter valores superiores ou iguais mediana.

    Para calcular a mediana inicia-se ordenando os valores em ordem crescente. Em seguida conta-se at a metade deles. Em geral a mediana ocupa a posio (n+1)/2.

    Para nmero mpar de valores a mediana o valor do meio. Para amostras com nmero par de unidades, a mediana a mdia dos dois valores centrais.

    Exemplos: Amostra Nmero de elementos Dados ordenados Mediana

    2 3 3 4 2 5 1 4 5 9 elementos mpar 1 2 2 3 3 4 4 5 5 3

    2 4 3 1 7 3 8 9 2 4 10 elementos par 1 2 2 3 3 4 4 7 8 9 3,5

    3 4 2 3 1 5 3 2

    6 7 3 2 5 2 3 6 2 1

  • Prof. Cntia Paese Giacomello 24

    Uma medida semelhante mediana o quartil. Os quartis dividem o conjunto ordenado de dados em quatro grupos iguais. 25% dos valores so inferiores ao primeiro quarti (Q1), 25% esto entre Q1 e a mediana, 25% esto entre a mediana e o terceiro quartil (Q3). OBS: o segundo quartil corresponde mediana (Q2=mediana).

    LI Q1 Q2=mediana Q3 LS

    LI = Limite inferior LS=Limite superior

    5.2.1 Clculo da mediana para uma distribuio de freqncia

    Da mesma forma que para dados apresentados em srie, a mediana o ponto que divide as informaes ao meio.

    A mediana pode ser obtida por interpolao, e dada pela frmula.

    cffn

    LMedianamediana

    )(2 1

    1

    +=

    onde: L1= limite inferior da classe mediana, isso , da classe que contm a mediana

    n = nmero de itens dos dados (freqncia total)

    (f)1=soma de todas as freqncias das classes anteriores mediana

    fmediana= freqncia da classe mediana

    c = amplitude do intervalo da classe mediana

    Exemplo:

    No caso dos acidentes, temos 50 observaes, logo a mediana deve estar localizada na posio (50+1)/2 = 25,5, ou seja, a classe que contm a mediana a classe 4-5.

    O limite inferior da classe mediana 4. Antes da classe mediana ((f)1) haviam passado 15 dados. A classe mediana contm 20 observaes e a amplitude da classe mediana 1.

    Ento

    54504120

    152

    50

    4 ,,xMediana =+=

    +=

  • Prof. Cntia Paese Giacomello 25

    5.3 Moda A moda o valor que aparece com maior freqncia na amostra. Um conjunto de dados pode no apresentar moda, apresentar uma moda, duas modas (bimodal), trs modas (trimodal) ou mais modas (polimodal).

    Exemplo: A moda do conjunto 2 3 4 3 2 3 5 1 2 3, pois o trs o valor que mais vezes aparece.

    5.3.1 Clculo da moda para uma distribuio de freqncia

    Quando no h perda da informao, a moda idntica ao valor da classe modal, que a classe com maior freqncia.

    Quando h perda da informao, a moda representa o(s) valor(es) de X correspondente(m) ao(s) ponto(s) de ordenada(s) mxima(s) da curva e pode ser calculada pela frmula:

    cLModa

    +

    +=21

    11

    onde: L1=limite inferior da classe modal (isto , a classe que contm a moda)

    1=excesso da freqncia modal sobre a da classe imediatamente anterior

    2= excesso da freqncia modal sobre a da classe imediatamente posterior

    c = amplitude da classe modal

    Exemplo:

    No caso dos acidentes....

    Classe N dias (f i) 0-1 6 2-3 9 4-5 20 6-7 10 8-9 5

    n = 50

    524520411011

    114 ,,Moda =+=

    ++=

    Classe modal

  • Prof. Cntia Paese Giacomello 26

    A distribuio pode ter mais de uma moda, sendo bimodal ou de modas mltiplas. OBS: as duas modas no precisam, necessariamente, ter a mesma freqncia. Isso acontece quando h um deslocamento da distribuio.

    5.4 Relao entre as medidas de tendncia central Para as curvas de freqncia unimodal moderadamente inclinadas (assimtricas) vigora a relao emprica

    Mdia Moda = 3 (Mdia Mediana)

    Exerccios:

    1. Para os seguintes conjuntos de dados, determine os valores da mdia aritmtica, mdia geomtrica, mdia harmnica, mediana e moda.

    a) 12 15 16 15 12 15 15 5 7 14

    b) 2 6 3 6 3 3 4

    c) 2 8 3 10 2 1 6 9 4 3

    d) 38 38 70 92 22 17

    Moda Classe modal Classes modais Classes modais

    Mediana

    Mdia

    Moda

    Mediana

    Mdia

    Moda Mediana

    Mdia

    Moda

  • Prof. Cntia Paese Giacomello 27

    2. Determine Q1, Q2 e Q3 nos conjuntos de dados que seguem:

    a) 15 15 4 7 16 16 4 11 7

    8 19 7 6 12 17 16 9 20

    16 14 3 12 4 9 8 3 16

    b) 4 12 4 7 4 9 11 12 5 8 9 4

    3. Qual seria o efeito sobre a mdia de um conjunto de dados se se adicionasse 10:

    a) a um dos nmeros? b) a cada um dos nmeros?

    4. Joo possui 5 imveis localizados nesta cidade. Ele deseja saber qual o valor mdio, por metro quadrado, das suas propriedades. Sabendo que imveis no centro valem R$ 450,00/m2 e imveis em bairros valem R$ 300,00/m2, calcule o valor mdio por m2 do seu capital.

    Apartamento de 80 m2 no centro Pavilho de 450 m2 no bairro Casa de 280 m2 no centro Apartamento de 120 m2 no bairro Casa de 320 m2 no bairro

  • Prof. Cntia Paese Giacomello 28

    66 MMeeddiiddaass ddee vvaarriiaabbiilliiddaaddee

    As medidas de variabilidade ou disperso indicam se os valores esto relativamente prximos ou no uns dos outros.

    Na anlise de um conjunto de dados necessrio que sejam observados tanto as informaes relativas localizao (medidas de tendncia central) quanto as informaes de disperso (medidas de variabilidade).

    Exemplo:

    Exemplo: Duas mquinas esto sendo comparadas. A seguir est descrita a produo de cada uma durante 5 dias.

    Produo Mdia

    Mq 1 10 10 10 10 10 10

    Mq 2 5 18 8 3 16 10

    Voc acha que a programao da produo para as duas mquinas pode ser a mesma durante 1 semana? Por qu?

    Consideraremos quatro medidas de disperso: amplitude, varincia, desvio padro e coeficiente de variao. Todas elas, exceto a amplitude, tm na mdia o ponto de referncia. Em cada caso, o valor zero indica ausncia de variao; a disperso aumenta proporo que aumenta o valor da medida (intervalo, varincia, etc.).

    6.1 Amplitude Tambm conhecida como intervalo.

    A amplitude de um grupo de dados , de modo geral, mais simples de calcular e de entender. Consiste na diferena entre o maior e o menor valor, ou seja, entre os valores extremos.

    Amplitude = Xmax - X mn

    Pequena variabilidade

    Grande variabilidade

  • Prof. Cntia Paese Giacomello 29

    A maior limitao da amplitude o fato de s levar em conta os valores extremos de um conjunto, nada informado sobre os outros valores.

    Exemplo: 1. Calcule a amplitude dos seguintes conjuntos de dados. Voc acha que a disperso

    dos conjuntos igual?

    a) 15 15 12 14 16 16 4 15

    b) 5 4 5 4 6 5 16 4

    6.2 Varincia Calcula-se a varincia de uma amostra elevando-se as diferenas de cada um dos valores em relao mdia, somando-se estas diferenas e dividindo-se por n-1.

    1

    22

    =

    n

    )xx(s ix

    Quando se deseja a varincia populacional, deve-se substituir n-1 por n na frmula. Usualmente iremos utilizar a varincia amostral.

    Exemplo: Clculo da varincia do conjunto de dados 2,4,6,8, e 10.

    x i x xx i ( xx i )2

    2 6 -4 16

    4 6 -2 4

    6 6 0 0

    8 6 2 4

    10 6 4 16

    Somas 0 40

    1015

    401

    22

    =

    =

    =

    n

    )xx(s ix

    6.3 Desvio padro O desvio padro simplesmente a raiz quadrada da varincia. Assim se a varincia 81, o desvio padro ser 9.

  • Prof. Cntia Paese Giacomello 30

    ( )11

    22

    2

    =

    =

    n

    nx

    x

    n

    )xx(s

    ii

    ix

    Como anteriormente, a substituio de n-1 por n produz as frmulas para a populao.

    A unidade na qual o desvio padro expresso a mesma dos dados originais, ou seja, se os dados so em Reais, o desvio padro tambm vai ser em reais (e a varincia em reais2).

    Exemplo: Clculo do desvio padro do conjunto de dados 20, 5, 10, 15 e 25.

    Usando a frmula normal:

    x i x xx i ( xx i )2

    20 15 5 25

    5 15 -10 100

    10 15 -5 25

    15 15 0 0

    25 15 10 100

    Somas 0 250

    91756215

    2501

    2

    ,,n

    )xx(s ix ==

    =

    =

    Usando a frmula simplificada:

    =++++= 75251510520ix

    =++++= 1375251510520 222222ix

    ( )917

    15250

    155

    7513751

    2

    22

    ,n

    nx

    x

    s

    ii

    x =

    =

    =

    =

    6.4 Coeficiente de variao O coeficiente de variao uma medida de variao til para comparar conjuntos de dados diferentes. Ele usualmente expresso em percentual.

    O coeficiente de variao dado pelo quociente entre o desvio padro e a mdia dos dados.

  • Prof. Cntia Paese Giacomello 31

    XS

    Mdiapadro Desvio

    CV x==

    Exemplo: Entre os conjuntos de dados a seguir apresentados, qual apresenta maior variabilidade?

    Conjunto A Conjunto B 12 3 25 4 16 5 23 2

    Soluo: 3187019066

    ,,

    MdiaA APadro Desvio

    CVA ===

    3688053

    291,

    ,,

    MdiaBB Padro Desvio

    CVB ===

    Ento o conjunto que possui maior variabilidade o conjunto B.

    Exerccios:

    1. O desvio padro pode ser zero? Explique. Pode ser negativo? Explique.

    2. Calcule a mdia e o desvio padro para as vendas dirias.

    R$ 8100 R$ 9000 R$ 4580 R$ 5600 R$ 7680 R$ 4800 R$ 10640

    3. Consideremos os seguintes dados correspondentes a preos de propostas.

    26,5 27,5 25,5 26,0 27,0 23,4 25,1 26,2 26,8

    Calcule a amplitude, a varincia, o desvio padro, a mdia, moda, mediana e os quartis

    77 MMeeddiiddaass ddee aassssiimmeettrriiaa ee ccuurrttoossee

    As medidas de assimetria e curtose indicam qual o formato da distribuio dos dados em relao distribuio normal (descrita adiante).

    Assimetria o grau de desvio, ou afastamento da simetria, de uma distribuio. Ela retorna a distoro de uma distribuio. O valor enviesado caracteriza o grau de assimetria de uma distribuio em torno de sua mdia. Um valor positivo indica uma distribuio com uma ponta assimtrica que se estende em direo a valores mais positivos. Um valor

  • Prof. Cntia Paese Giacomello 32

    negativo indica uma distribuio com uma ponta assimtrica que se estende em direo a valores mais negativos. No excel a funo correspondente distoro.

    Assimetria =

    3

    21 sxx

    )n)(n(n i

    A curtose o grau de achatamento de uma distribuio e caracteriza uma distribuio em cume ou plana se comparada distribuio normal (chamada mesocrtica). A curtose positiva indica uma distribuio relativamente em cume (chamada leptocrtica). A curtose negativa indica uma distribuio relativamente plana (chamada platicrtica). A funo correspondente no excel chama-se CURT, e calcula a curtose de um conjunto de dados de, no mximo, 30 valores.

    Curtose = )n)(n(

    )n(s

    xx)n)(n)(n(

    )n(n i32

    13321

    1 24

    +

    Simtrica

    a=0

    Assimtrica negativa

    a0

    Mesocrtica

    c=0

    Platicrtica

    c0

  • Prof. Cntia Paese Giacomello 33

    88 IInnttrroodduuoo pprroobbaabbiilliiddaaddee

    As origens da probabilidade remontam ao sculo XVI. As aplicaes iniciais referiam-se quase todas a jogos de azar. Os jogadores aplicavam o conhecimento da teoria das probabilidades para planejar estratgias de apostas.

    Atualmente a utilizao das probabilidades ultrapassou de muito o mbito desses jogos. Hoje os governos, as empresas, as organizaes profissionais incorporam a teoria das probabilidades em seus processos dirios de deliberaes.

    Independentemente de qual seja a aplicao em particular, a utilizao das probabilidades indica que existe um elemento de acaso, ou de incerteza, quanto ocorrncia ou no de um evento futuro. Assim que, em muitos casos, pode ser virtualmente impossvel afirmar por antecipao o que ocorrer, mas possvel dizer o que pode ocorrer.

    H numerosos exemplos de tais situaes no campo dos negcios e do governo. A previso da procura de um novo produto, o clculo dos custos da produo, a previso das safras, a compra de aplices de seguros, a avaliao da reduo de impostos sobre a inflao. As probabilidades so teis pois ajudam a desenvolver estratgias.

    O ponto central em todas as situaes a possibilidade de quantificar quo provvel determinado evento.

    As probabilidades so utilizadas para exprimir a chance de ocorrncia de determinado evento. O estudo das probabilidades importante pois elas so a base para o estudo estatstico.

    8.1 Experimento aleatrio Experimentos aleatrios so aqueles que, mesmo repetidos vrias vezes sob condies semelhantes, apresentam resultados imprevisveis.

    Caractersticas dos experimentos aleatrios:

    1. Podem ser repetidos indefinidamente sob as mesmas condies.

    2. No se pode adiantar um resultado particular, mas pode-se descrever todos os resultados possveis

    3. Se repetidos muitas vezes apresentaro uma regularidade em termos de freqncia de resultados.

    Exemplos: lanamento de uma moeda, lanamento de um dado, aposta na loteria, ....

    Ao descrever um experimento aleatrio deve-se especificar no somente que operao ou procedimento deva ser realizado, mas tambm o que dever ser observado. (Note a diferena entre o 2o e o 3o)

    Joga-se um dado e observa-se o nmero obtido na face superior.

    Joga-se uma moeda 4 vezes e o observa-se o nmero de caras obtido.

  • Prof. Cntia Paese Giacomello 34

    Joga-se uma moeda 4 vezes e observa-se a seqncia de caras e coroas.

    Um lote de 10 peas contm 3 defeituosas. As peas so retiradas uma a uma (sem reposio) at que a ltima defeituosa seja encontrada. Conta-se o nmero de peas retiradas.

    Uma lmpada nova ligada e observa-se o tempo gasto at queimar.

    Lana-se uma moeda at que ocorra uma cara e conta-se ento o nmero de lanamentos necessrios.

    Lanam-se dois dados e anota-se o total de pontos obtidos.

    Lanam-se dois dados e anota-se o par obtido.

    8.2 Espao amostral O espao amostral (S) de um experimento aleatrio o conjunto de todos os possveis resultados do experimento.

    n(S) o nmero de elementos do conjunto S, ou o nmero de resultados possveis.

    Exemplo: um experimento o lanamento de uma moeda. Os possveis resultados so cara ou coroa, ento, S={cara, coroa}.

    Em dois lanamentos de uma moeda, sendo interessante observar a ordem dos resultados, os possveis resultados so: 1) cara e cara, 2) cara e coroa, 3) coroa e cara e 4) coroa e coroa. O espao amostral S={(Ca,Ca), (Ca,Co), (Co,Ca) e (Co,Co)}. n(S)=4

    8.3 Eventos Chama-se de evento qualquer subconjunto do espao amostral S de um experimento aleatrio, ou seja, qualquer resultado do espao amostral.

    n(A) o nmero de resultados associados ao evento A.

    Exemplo: no lanamento de uma moeda S={cara, coroa}. Um evento de interesse A pode ser obter cara no lanamento de uma moeda e n(A)=1.

    No lanamento de um dado, o evento de interesse (A) pode ser obter face par e n(A)=3.

    8.4 A probabilidade de um evento Seja A um evento. A probabilidade deste evento ocorrer dada por P(A), que um nmero entre 0 e 1. Quanto mais prxima a probabilidade estiver de 1, maior ser sua chance de ocorrncia. A um evento impossvel atribui-se probabilidade 0, enquanto que um evento certo tem probabilidade 1.

    H trs maneiras diferentes de calcular ou estimar probabilidades: o mtodo clssico, quanto o espao amostral tem resultados igualmente provveis. O mtodo emprico, que

  • Prof. Cntia Paese Giacomello 35

    se baseia na freqncia relativa de ocorrncia de um evento num grande nmero de provas repetidas e o mtodo subjetivo, que utiliza estimativas pessoais de probabilidade, baseadas num certo grau de crena. Em geral vamos utilizar o mtodo clssico de clculo de probabilidades.

    Quando os resultados so equiprovveis, a probabilidade de cada resultado funo do nmero de resultados possveis:

    possveis resultados de total meron Aevento ao associados resultados de nmero

    )A(P =

    Exemplo:

    Experimento: lanar um dado e observar a face superior

    Espao amostral: S={1,2,3,4,5,6} n(S)=6

    Evento A: face par n(A)=3

    P(A)= 3/6 = = 0,5 ou 50%

    OBS: existe uma pequena diferena entre probabilidade e chance de um evento. A probabilidade

    relaciona o nmero de resultados de A com o nmero de resultados total, enquanto que chance

    compara o nmero de resultados de A com o nmero de resultados de outro evento (B ou C).

    Em uma urna com 5 bolas brancas, 3 vermelhas e 2 azuis,

    A probabilidade de selecionar uma bola branca P(branca)=5/10=0,5 ou 50%

    E a chance de selecionar uma bola branca 5:5, que semelhante a 1:1, o que significa que existe a

    mesma chance de retirar uma bola branca ou uma bola de outra cor.

    Exerccios: 1. Escreva o espao amostral no lanamento de um dado. Ache a probabilidade

    associada a cada evento.

    2. Extrai-se uma carta de um baralho de 52 cartas. Determine a probabilidade de:

    a) um valete

    b) uma carta vermelha

    c) um dez de paus

    d) uma figura

    e) uma carta de ouros

    f) um nove vermelho

  • Prof. Cntia Paese Giacomello 36

    3. Complete a tabela com os valores calculados da probabilidade dos eventos ocorrerem

    Experimento Evento P(Evento)

    Lanar uma moeda uma vez Cara

    Lanar um dado uma vez Face 3

    Extrair uma carta de um baralho com 52 cartas 6 vermelho

    Extrair uma carta de um baralho de 52 cartas

    Valete de ouros

    4. Encontre n(S), n(A) e P(A) no lanamento de dois dados

    Experimento: Lanar dois dados e observar a seqncia dos resultados

    S={(1,1), (1,2), (1,3),.....,(6,4),(6,5),(6,6)} N(S)=36

    a. A: apaream faces iguais

    b. A: a segunda face o dobro da primeira

    c. A: apaream somente nmeros mpares

    d. A: apaream faces iguais ou a segunda face o quadrado da primeira

    e. A: a soma das faces igual a 7

    5. H 50 bolas numa urna: 20 azuis, 15 vermelhas, 10 pretas e 5 verdes. Misturam-se as bolas. Determine a probabilidade da bola escolhida ser:

    a) Verde

    b) Azul

    c) Verde ou azul

    d) No-vermelha

    e) Vermelha ou verde

    f) Amarela

    g) No-amarela

  • Prof. Cntia Paese Giacomello 37

    6. Um motorista tem uma marca num de seus pneus, e 20% do pneu visvel. Ao parar, qual a probabilidade da marca ficar na parte visvel?

    7. Um motor tem 6 velas, e uma est defeituosa, devendo ser substituda. Duas esto em posio de difcil acesso, o que torna difcil a substituio.

    a) Qual a probabilidade de a vela defeituosa estar em posio difcil?

    b) Qual a de no estar em posio difcil?

    8. Os dados compilados pela gerncia de um supermercado indicam que 915 dentre 1500 clientes compradores de domingo gastam mais de R$ 40,00 em suas compras. Estime a probabilidade de um comprador em qualquer domingo gastar mais de R$ 40,00.

    9. Uma pesquisa de trfego levada a efeito das 5 s 6 horas da manh num trecho de uma rodovia federal revelou que, de 200 carros que pararam para uma verificao rotineira de segurana, 25 tinham pneus em ms condies. Estime a probabilidade de um carro que pare naquele trecho ter seus pneus em boas condies

    8.5 Clculo das probabilidades Muitas aplicaes da estatstica exigem a determinao da probabilidade de combinaes dos eventos. H duas caractersticas de combinaes. Pode ser necessrio determinar a probabilidade de ambos os eventos acontecerem P(A e B) ou a probabilidade de um deles, A ou B, ou seja, P(A ou B).

    Em um prdio com 2 elevadores, poderamos perguntar: Qual a probabilidade de ambos elevadores estarem em servio? Ou ento, Qual a probabilidade de um ou outro elevador estar em servio?

    Ambos implica P(A e B)

    Um ou outro implica P(A ou B)

  • Prof. Cntia Paese Giacomello 38

    Regra da adio:

    A regra da adio leva em conta a ocorrncia do evento A ou do evento B ou de ambos os eventos e denotada por P(AB).

    P(A ou B) = P(A) + P(B) P(A e B)

    Quando os eventos so mutuamente excludentes (no tem elementos em comum), ento a probabilidade de ambos nula e o termo P(A e B) ser zero.

    Se A e B so mutuamente excludentes P(A ou B) = P(A) + P(B)

    OBS: Para apresentar os eventos utilizam-se os Diagramas de Venn [apresentados por John Venn

    (1834-1923)], que representam os espaos amostrais e os eventos como crculos, quadrados, ou outra

    figura geomtrica conveniente.

    Exerccios: 1. Numa urna existem 10 bolas numeradas de 1 a 10. Retira-se uma bola ao acaso.

    Qual a probabilidade do nmero ser par ou maior que 4?

    2. Numa urna existem 10 bolas numeradas de 1 a 10. Retira-se uma bola ao acaso. Qual a probabilidade do nmero ser um nmero primo ou maior que 8?

    A B

  • Prof. Cntia Paese Giacomello 39

    Regra da multiplicao

    Considerando-se dois eventos A e B de um mesmo espao amostral, a probabilidade de A e B ocorrerem P(AB) dada por:

    A probabilidade de A e B igual probabilidade de A, dado B, vezes a probabilidade de B.

    P(A e B) = P(A|B) P(B)

    Onde P(A|B) a probabilidade de A ocorrer dado que B tenha ocorrido.

    Quando a probabilidade de B ocorrer no depender de A ter ocorrido, dizemos que A e B so independentes, e P(B| A)=P(B)

    Se A e B so independentes P(A e B)=P(A)P(B)

    Exemplo 1: Deve-se inspecionar uma grande caixa de peas. Os registros indicam que 2% das caixas acusam contedo inferior ao estipulado. Escolhidas duas caixas aleatoriamente, qual a probabilidade de ambas acusarem contedo inferior, admitindo-se que a remessa inspecionada semelhante as anteriores (isto , 2% de deficientes)?

    P(ambas deficientes)=P(deficiente)P(deficiente)

    =0,02 x 0,02

    =0,0004 ou seja, 0,04% de probabilidade das caixas serem defeituosas.

    Exemplo 2: Suponha que 20 canetas esto expostas numa papelaria. Seis so vermelhas e 14 azuis. Do conjunto de 20, iremos escolher 2 canetas aleatoriamente. Qual a probabilidade de que as duas canetas selecionadas sejam vermelhas?

    Neste caso os eventos no so independentes, pois a cor da primeira caneta selecionada vai determinar a probabilidade da segunda caneta ser vermelha.

    Seja A=a segunda caneta selecionada vermelha

    B=a primeira caneta selecionada vermelha

    Desejamos P(A e B) = P(A|B) P(B) = 0789038030

    206

    195

    ,=

    =

    A B

  • Prof. Cntia Paese Giacomello 40

    Regras de probabilidade

    P(A ou B), Para eventos no mutuamente excludentes:

    P(A ou B ou ambos) = P(A) + P(B) P(A e B)

    para eventos mutuamente excludentes:

    P(A ou B) = P(A) + P(B)

    P(A e B), para eventos independentes:

    P(A e B) = P(A) . P(B)

    Para eventos dependentes

    P(A e B) = P(B).P(A/B) ou P(A).P(B/A)

    Outra forma de apresentar os eventos atravs de tabelas de contingncia (tabelas com cruzamento de classificaes).

    Por exemplo:

    Vermelha Preta Totais

    s 2 2 4

    No s 24 24 48

    Totais 26 26 52

    Exerccios

    1. Uma urna contm 6 bolas vermelhas e 4 azuis. Em duas bolas consecutivas, sem reposio, determine a probabilidade de retirar a primeira azul e a segunda vermelha.

    2. Uma urna contm 6 bolas vermelhas e 4 azuis. Em duas bolas consecutivas, com reposio, determine a probabilidade de retirar a primeira azul e a segunda vermelha.

    3. Em um lote de 12 peas, quatro so defeituosas. Retira-se uma pea e inspeciona-se. Qual a probabilidade:

    a. Da pea ser defeituosa

    b. Dela no ser defeituosa

  • Prof. Cntia Paese Giacomello 41

    4. Uma loja dispe de pneus novos e recapados. Entre 100 pneus, sabe-se que 30 so recapados.

    a. Se um cliente levar um pneu, qual a probabilidade de que ele seja recapado?

    b. Se um cliente levar dois pneus, qual a probabilidade de que ambos sejam recapados?

    c. Se um cliente levar 4 pneus, qual a probabilidade de que todos sejam recapados?

    5. Um dado lanado 3 vezes. Calcule a probabilidade de que se obtenha face 6 nos 3 lanamentos.

    6. Uma urna contm 50 bolas numeradas de 1 a 50. Sero selecionadas 5 bolas, sem reposio. Qual a probabilidade de que uma pessoa que tenha feito um jogo anotando os 5 nmero acerte todos?

  • Prof. Cntia Paese Giacomello 42

    7. Nos ltimos anos, as empresas de cartes de crdito intensificaram esforos no sentido de abrir mais contas para alunos de faculdade. Suponha que uma amostra de 200 alunos em sua faculdade apresentou as seguintes informaes em termos de o aluno possuir carto de crdito bancrio e/ou carto de crdito de viagem e entretenimento:

    CC de viagem e entretenimento

    Sim No Totais

    Sim 60 60 120 CC bancrio

    No 15 65 80

    Totais 75 125 200

    a. Se um aluno selecionado aleatoriamente, qual a probabilidade de que o aluno possua um carto de crdito bancrio?

    b. Se um aluno selecionado aleatoriamente, qual a probabilidade de que o aluno no possua um carto de crdito bancrio?

    c. Se um aluno selecionado aleatoriamente, qual a probabilidade de que o aluno possua um carto de crdito bancrio e um carto de viagem e entretenimento?

    d. Se um aluno selecionado aleatoriamente, qual a probabilidade de que o aluno no possua um carto de crdito bancrio nem carto de viagem e entretenimento?

    e. Se um aluno selecionado aleatoriamente, qual a probabilidade de que o aluno possua um carto de crdito bancrio ou possua um carto de viagem e entretenimento?

    f. Suponha que um aluno possui um carto de crdito bancrio. Qual a probabilidade de que ele possua um carto de viagem e entretenimento?

    g. Suponha que o aluno no possui um carto de viagem e entretenimento. Qual a probabilidade de que ele ou ela possua um carto de crdito bancrio?

    h. Os dois eventos, possuir um carto de crdito bancrio e possuir um carto de viagem e entretenimento, so estatisticamente independentes? Explique.

  • Prof. Cntia Paese Giacomello 43

    99 DDiissttrriibbuuiieess ddee pprroobbaabbiilliiddaaddee

    O histograma usado para apresentar dados amostrais (Amostra=conjunto de observaes extradas de uma populao)

    Por exemplo, 50 valores de satisfao dos clientes so interpretados como uma amostra da satisfao de todos os clientes.

    O uso de mtodos estatsticos permite que se analise essa amostra e se tire alguma concluso sobre a satisfao dos clientes.

    Uma distribuio de probabilidade um modelo matemtico que relaciona um certo valor da varivel em estudo com a sua probabilidade de ocorrncia.

    H dois tipos de distribuio de probabilidade

    1. Distribuies Contnuas: Quando a varivel que est sendo medida expressa em uma escala contnua, como por exemplo, o peso de peas produzidas, dimetro, etc.

    2. Distribuies Discretas: Quando a varivel que est sendo medida s pode assumir certos valores, como por exemplo os valores inteiros 0, 1, 2, etc.

    No caso de distribuies discretas, a probabilidade que a varivel X assuma um valor especfico xo dada por: P {X = xo} = P(xo)

    No caso de variveis contnuas, as probabilidades so especificadas em termos de intervalos:

    Relembrando: uma varivel aleatria uma funo com valores numricos, cujos valores so determinados por fatores de chance.

    Uma varivel aleatria considerada discreta se toma valores que podem ser contados.

    Uma varivel aleatria considerada contnua quando pode tomar qualquer valor em determinado intervalo.

    { }P a x b f x dxab = ( )

  • Prof. Cntia Paese Giacomello 44

    Os grficos a seguir apresentam exemplos de distribuies de probabilidades discreta e contnua.

    Exemplo:

    Distribuio de probabilidade para a varivel aleatria nmero de caras em duas jogadas de uma moeda.

    Resultado Nmero de

    caras Valor da V.A.

    Prob. do resultado

    Nmero de caras

    Valor da V.A

    Prob. do resultado

    Cara Cara 2 x = 0

    Cara Coroa 1 x =

    Coroa Cara 1 x = 1 + =

    Coroa Coroa 0 x = 2

    Soma = 1 Soma = 1

    O valor esperado, ou esperana matemtica, de uma varivel aleatria E(x), que consiste no valor esperado para ela, ou seja, o valor mdio da varivel.

    =

    =

    n

    iiixp)x(E

    1 se X v.a. discreta

    ou

    = dx f(x) .x)X(E se X v.a. contnua

    E a varincia de X dada por 22 )]X(E[)X(E)X(Var = .

    O desvio padro )X(Var

  • Prof. Cntia Paese Giacomello 45

    Neste exemplo, o valor esperado 0 . + 1 . + 2 . = 1.

    E a varincia Var(X)=E(X2)-[E(X)]2= E(X2) - 1= (02. + 12 . + 22 .) 1 =1,5-1=0,5 E o desvio padro = 0,71

    Exemplo: um investidor julga que tem 0,4 de probabilidade de ganhar $ 25.000 e 0,6 de perder $ 15.000. Seu ganho esperado de:

    E(X) = 0,4 (25.000) + 0,6 (-15.000) = $ 1.000.

    E a varincia Var(X)=E(X2)-[E(X)]2

    = E(X2) 1.0002

    =(0,4.25.0002 + 0,6.(-15.000)2)-1.0002

    =(0,4 x 625.000.000 + 0,6 x 225.000.000)-1.0002

    = 250.000.000+ 135.000.000 1.0002

    = 385.000.000 1.000.000

    = 384.000.000

    Desvio padro = $ 19.595,92

    Exerccios:

    1. O nmero de chamadas telefnicas recebidas por uma mesa e suas respectivas probabilidades para um intervalo de 3 minutos so:

    Nmero de chamadas 0 1 2 3 4 5 Total

    Freqncia relativa 0,60 0,20 0,10 0,04 0,03 0,03 1,00

    Em mdia, quantas chamadas podem ser esperadas num intervalo de trs minutos?

    2. Um bilhete de loteria tem 0,00001 de chance de dar um prmio de $ 100.000, 0,00002 de chance de dar um prmio de $ 50.000 e 0,004 de chance de um prmio de $ 25. Qual seria o preo justo de venda do bilhete?

    3. Uma confeitaria estabeleceu um registro de vendas para certo tipo de bolo. Determine o nmero esperado de bolos encomendados.

    N bolos/dia 0 1 2 3 4 5 6 7 8 9 Total

    Freqncia relativa 0,02 0,07 0,09 0,12 0,20 0,20 0,18 0,10 0,01 0,01 1,00

  • Prof. Cntia Paese Giacomello 46

    9.1.1 Distribuies discretas mais importantes

    As principais distribuies discretas so a Distribuio de Bernoulli, Distribuio Binomial e Distribuio Poisson.

    Distribuio de Bernoulli

    A distribuio de Bernoulli consiste em uma distribuio adequada varivel aleatria de Bernoulli, que por sua vez uma v.a. que assume apenas os valores 0 e 1, com funo de probabilidade tal que:

    P(0) = P(X=0) = 1-p

    P(1) = P(X=1) = p

    Ento, E(X)=p e Var(X)=p(1-p)

    Distribuio Binomial

    Seja um processo composto de uma seqncia de observaes independentes, onde o resultado de cada observao pode ser um sucesso ou uma falha.

    Se a probabilidade de sucesso constante e igual a p, a distribuio do nmero de sucessos seguir o modelo Binomial.

    A distribuio Binomial usada com freqncia no controle de qualidade. o modelo apropriado quando a amostragem feita sobre uma populao infinita ou muito grande.

    A distribuio binomial possui quatro propriedades essenciais:

    1. As observaes possveis podem ser obtidas atravs de dois diferentes mtodos de amostragem. Cada observao pode ser considerada como se tivesse sido selecionada a partir de uma populao infinita sem reposio ou a partir de uma populao finita com reposio.

    2. Cada observao pode ser classificada em uma de duas categorias mutuamente excludentes e coletivamente exaustivas, usualmente chamadas sucesso ou falha.

    3. A probabilidade de uma observao ser classificada como sucesso (p) constante de observao para observao. Assim sendo, a probabilidade de fracasso 1-p tambm constante.

    4. O resultado (isto , sucesso ou fracasso) de qualquer observao independe do resultado de qualquer outra observao.

    Em aplicaes de controle da qualidade, x em geral representa o nmero de defeituosos observados em uma amostra de n itens.

  • Prof. Cntia Paese Giacomello 47

    xnx )p(pxn

    )x(P

    = 1 e

    )!xn(!x!n

    xn

    =

    onde

    xn

    representa o nmero de combinaes de n objetos tomados x de cada vez

    P(X) = probabilidade de X sucessos uma vez que n e p so conhecidos

    n = tamanho da amostra

    p = probabilidade de sucesso 1-p = probabilidade de falha

    X = nmero de sucessos na amostra (X=0, 1, 2, ..., n)

    A mdia de uma varivel aleatria com distribuio binomial = np e a varincia

    dada por 2= np(1-p) onde p proporo de sucessos na amostra nx

    p =

    Exemplo: Um processo industrial opera com mdia de 1% de defeituosos. Baseado em amostras de 100 unidades, calcule as probabilidades de uma amostra apresentar 0 , 1 , 2 , 3 e 4 defeituosos. Plote a distribuio de probabilidade correspondente.

    Como a varivel aleatria pode apresentar apenas duas possibilidades, ser boa ou defeituosa, a distribuio que melhor se ajusta a distribuio binomial, com parmetros p=0,01 e n=100.

    Ento, a probabilidade de uma amostra de tamanho n = 100 apresentar 0 defeituosos

    xnx )p(pxn

    )x(P

    = 1 P(x=0) = P(0) = =

    01000 0101010

    0100

    ),(, 0,366

    P(x=1) = P(1) = =

    11001 0101010

    1100

    ),(, 0,370

    P(x=2) = P(2) = =

    21002 0101010

    2100

    ),(, 0,185

    P(x=3) = P(3) = =

    31003 0101010

    3100

    ),(, 0,061

    P(x=4) = P(4) = =

    41004 0101010

    4100

    ),(, 0,015

  • Prof. Cntia Paese Giacomello 48

    0

    0,1

    0,2

    0,3

    0,4

    x=0 x=1 x=2 x=3 x=4P(

    x)

    Exerccios:

    1. Um processo opera segundo uma chance de falha de 2%. Coletando amostras de 25 unidades, qual a probabilidade de uma amostra selecionada apresentar 2 defeituosos ou menos.

    2. Imagine que para o processo anterior, fossem coletadas amostras de 50 unidades e o critrio para parar o processo e procurar causas especiais fosse X=1 ou mais. Calcule a percentagem de vezes que o processo seria interrompido logo aps a amostragem.

    Distribuio de Poisson

    A aplicao tpica da distribuio de Poisson no controle da qualidade como um modelo para o nmero de defeitos (no-conformidades) que ocorre por unidade de produto (por m2, por volume ou por tempo)

    Diz-se que existe um processo de Poisson se pudermos observar eventos discretos numa rea de oportunidade um intervalo contnuo (de tempo, de comprimento, de rea, ...) de maneira tal que, se encurtarmos a rea de oportunidade ou intervalo suficientemente:

    1. A probabilidade de se observar exatamente um sucesso no intervalo estvel

  • Prof. Cntia Paese Giacomello 49

    2. A probabilidade de se observar mais de um sucesso no intervalo zero

    3. A ocorrncia de um sucesso em qualquer intervalo estatisticamente independente da ocorrncia em qualquer outro intervalo

    A distribuio de Poisson tem um parmetro (lambda) que a mdia ou o nmero esperado de sucessos por unidade. A varincia desta distribuio 2=. O nmero de sucessos X da varivel aleatria de Poisson varia de 0 a .

    A expresso matemtica para a distribuio de Poisson para se obterem X sucessos, dado que sucessos so esperados :

    !xe

    )x(Px

    = onde x=0,1,2,....

    onde P(X) = probabilidade de X sucessos, dado o conhecimento de

    = nmero esperado de sucessos

    e = constante matemtica (aproximadamente 2,71828)

    X = nmero de sucessos por unidade

    Exemplo: Suponha que o nmero de defeitos no cordo de solda de uma carroceria siga uma distribuio de Poisson com = 2.

    Ento a probabilidade de uma carroceria apresentar mais de 3 defeitos ser:

    P(X> 3) = 1 P(x3) = 1-[ P(x=0) + P(x=1) + P(x=2) + P(x=3)]

    Onde !x

    e)x(P

    x=

    !e

    )(P0

    2002

    = = 0,135

    P(x=1) = !

    e)(P

    121

    12

    = = 0,271

    P(x=2) = P(2) = 0,271 P(x=3) = P(3) = 0,180 Logo,

    P(X> 3) = 1 P(x3) = 1-[ P(x=0) + P(x=1) + P(x=2) + P(x=3)]

    = 1 [0,135+0,271+0,271+0,180]

    = 1 [0,857]

    =0,143 14%

    A probabilidade de uma carroceria apresentar mais de trs defeitos 14%.

    Exemplo 2:

  • Prof. Cntia Paese Giacomello 50

    Se chegam em mdia 2 carros por minuto em um posto de gasolina, qual a probabilidade de que cheguem exatamente 5 carros em dois minutos?

    Neste caso o tempo diferente do tempo correspondente ao . Ento deve-se transformar o para que ele corresponda ao tempo de 2 minutos. Chegam em mdia 2 carros por minuto chegam em mdia 4 carros em 2 minutos

    = 4

    !xe

    )x(Px

    =

    !54)5(

    54

    =

    eP = 0,1563 = 15,63%

    Exerccios:

    1. O setor financeiro de uma loja de departamentos est tentando controlar o nmero de erros cometidos na emisso das notas fiscais. Suponha que esses erros sigam o modelo de Poisson com mdia = 0,03. Qual a probabilidade de uma nota selecionada ao acaso conter 1 ou mais erros?

    2. Em uma indstria automotiva, defeitos superficiais de pintura ocorrem a uma taxa de 0,15 defeitos/unidade. Encontre a probabilidade que uma unidade escolhida ao acaso apresente 1 ou mais defeitos superficiais.

    3. Em uma empresa industrial ocorrem, em mdia, 3 acidentes por ms. Qual a probabilidade de que em um determinado ms, ocorra apenas um acidente?

    4. Dez por cento das ferramentas produzidas por um certo processo de fabricao revelaram-se defeituosas. Determinar a probabilidade de, em uma amostra de 10 ferramentas escolhidas ao acaso, exatamente duas serem defeituosas mediante o emprego da distribuio de Poisson.

    5. Se a probabilidade de um indivduo sofrer uma reao nociva, resultante da injeo de um determinado soro 0,001, qual a probabilidade de, entre 2000 indivduos, a) exatamente 3 sofrerem aquela reao? b) Mais de 2 sofrerem a reao?

  • Prof. Cntia Paese Giacomello 51

    9.1.2 Distribuies contnuas

    A distribuio mais importante e mais utilizada na prtica a Distribuio Normal. Outros modelos importantes de distribuies contnuas so: Uniforme, Exponencial, Gama, Qui-Quadrado, t de Student e F de Snedecor.

    Distribuio Normal

    A Distribuio Normal essencialmente importante na estatstica por trs razes principais:

    1. Inmeros fenmenos contnuos parecem segu-la ou podem ser aproximados por meio dela

    2. Podemos utiliz-la para aproximar vrias distribuies de probabilidade discretas

    3. Ela oferece a base para a inferncia estatstica clssica, devido sua afinidade com o teorema do limite central

    Os parmetros da distribuio Normal so a mdia e o desvio padro. Trata-se de uma distribuio simtrica, unimodal, em forma de sino.

    A funo de probabilidade da distribuio normal dada por:

    2

    21

    21

    =

    pi

    x

    exp)x(f

    onde: e = constante matemtica (aproximada por 2,71828)

    pi = constante matemtica (aproximada por 3,14159)

    = mdia aritmtica da populao

    = desvio padro da populao

    X = qualquer valor da varivel aleatria contnua onde - < X <

  • Prof. Cntia Paese Giacomello 52

    Para simplificar a notao de uma v.a.c. com distribuio normal, com mdia e varincia 2 utiliza-se:

    X~ N(,2)

    A distribuio Normal acumulada obtida calculando a probabilidade de X ser menor que um dado valor a:

    ==a

    dx)x(f)a(F)ax(P Funo densidade acumulada

    Essa integral no pode ser resolvida em forma fechada, mas a soluo est apresentada em tabelas onde se entra com a varivel reduzida ou varivel padronizada Z e encontra-se F(Z) ou vice-versa.

    )Z(Fa

    ZP)ax(P =

    =

    Valor tabelado (Procurar na tabela da distribuio Normal padronizada)

    99,73%

    95,44%

    68,26%

    -1 +1

    -2 +2

    -3 +3

  • Prof. Cntia Paese Giacomello 53

    Exemplo: O peso de um produto uma caracterstica muito importante. Sabe-se que o peso segue um modelo normal com mdia 1000 gramas e desvio padro 40 gramas. Se a especificao tcnica estabelece que o peso deve ser maior que 950 gramas, qual a probabilidade de que um pacote selecionado aleatoriamente satisfaa a especificao?

    OBS: este esquema equivale

    P(x>950) = 89440500003944025140

    1000950,,,),Z(PZP =+=>=

    >

    A probabilidade de que um pacote selecionado aleatoriamente satisfaa a especificao de 89%.

    Exemplo 2: Sabe-se que X representa medies feitas em um processo que segue o modelo Normal com mdia 100 e desvio padro 10. Se forem feitas 4000 medies, quantas estaro entre 95 e 112?

    P(95

  • Prof. Cntia Paese Giacomello 54

    Exerccios:

    1. A resistncia trao do papel usado em sacolas de supermercado uma caracterstica de qualidade importante. Sabe-se que essa resistncia segue um modelo Normal com mdia 40 psi e desvio padro 2 psi. Se a especificao estabelece que a resistncia deve ser maior que 35 psi, qual a probabilidade que uma sacola produzida com este material satisfaa a especificao?

    2. O dimetro do eixo principal de um disco rgido segue a distribuio Normal com mdia 25,08mm e desvio padro 0,05mm. Se as especificaes para esse eixo so 25,00 0,15mm (isto , varia de 24,85 a 25,15mm), determine o percentual de unidades produzidas em conformidades com as especificaes.

    3. A resistncia trao de isoladores cermicos apresenta distribuio Normal com mdia 95 Kg e desvio padro 4 Kg. Se so produzidas 10.000 unidades desses isoladores, quantos apresentaro resistncia inferior a 85 Kg? E quantos apresentaro resistncia superior a 90 Kg?

    4. A sada de uma bateria segue o modelo Normal com mdia 12,15 V e desvio padro 0,2 V. Encontre o percentual que ir falhar em atender s especificaes 12 V 0,5 V.

  • Prof. Cntia Paese Giacomello 55

    5. A vida til de lavadora de pratos automticas de 1,5 anos, com desvio padro 0,3 anos. Se os defeitos se distribuem normalmente, qual a probabilidade de uma lavadora necessitar conserto antes de expirar o perodo de 1 ano de garantia?

    6. O tempo necessrio, em uma oficina, para o conserto de transmisso para certo carro normalmente distribudo com mdia 45 min e desvio padro 8 min. O mecnico planeja comear o conserto do carro 10 min aps o cliente deix-lo na oficina, comunicando que o carro estar pronto em 1 h. Qual a probabilidade de que o cliente tenha que esperar caso o mecnico esteja enganado e o cliente fique esperando?

    7. Sabe-se que o contedo de uma lata de cerveja 350 ml e que tem distribuio aproximadamente normal com mdia 350 ml e desvio padro 10 ml.

    a. Que % de latas tem menos que 345 ml de contedo?

    b. Que % de latas tem mais que 360 ml de contedo?

    8. Uma fbrica de pneus fez um teste para medir o desgaste de pneus e verificou que ele seguia o comportamento de uma curva normal com mdia 48.000 km e desvio padro de 2.000 km. Calcule a probabilidade de um pneu escolhido ao acaso:

    a. Dure mais que 47.000 km?

    b. Dure entre 45.000 e 51.000 km?

    c. At que quilometragem duram 90% dos pneus?

    9. Descreva um exemplo de aplicao da distribuio normal na sua profisso. Qual seria a mdia dos dados e o desvio padro?

  • Prof. Cntia Paese Giacomello 56

    1100 TTeeoorriiaa eelleemmeennttaarr ddaa aammoossttrraaggeemm

    A teoria da amostragem o estudo das relaes existentes entre uma populao e as amostras dela extradas. muito utilizada para a estimao das grandezas desconhecidas da populao (parmetros) atravs de conhecimento das grandezas correspondentes nas amostras (estatsticas amostrais).

    A teoria da amostragem tambm til para determinar se as diferenas observadas entre duas amostras so devidas a uma variao casual ou so verdadeiramente significativas. Por exemplo: queremos testar se os tempos de processamento da matria prima de dois sistemas de produo so diferentes ou no. A resposta a esta questo implica o uso de testes de hiptese, que ser visto mais adiante.

    Denomina-se inferncia estatstica a inferncia de parmetros (da populao) com base nos resultados obtidos na amostra.

    Para que as concluses sejam vlidas, necessrio que a amostra selecionada seja representativa da populao. Para isso podem ser utilizados os mtodos de amostragem probabilsticos apresentados no captulo 1: aleatria, sistemtica, estratificada ou por conglomerados. O mtodo mais utilizado o por amostragem aleatria.

    10.1 Amostragem com e sem reposio Quando selecionamos uma amostra devemos analisar se esta amostragem com ou sem reposio. Na amostragem com reposio o mesmo elemento pode ser escolhido mais de uma vez. Na amostragem sem reposio cada elemento s pode ser selecionado uma nica vez.

    Exemplo: uma urna contm dez bolas, numeradas de 0 a 9. Retira-se a primeira bola, anota-se o nmero, 3 por exemplo, e no se recoloca a bola na urna. Os outros nmeros que podem ser sorteados so 0, 1, 2, 4, 5, 6, 7, 8 e 9. Este sistema o sistema sem reposio. Entretanto, se tivssemos recolocado a bola 3 na urna, ento todos os nmeros poderiam ser selecionados na segunda extrao, inclusive o 3. Este sistema chamado sistema com reposio.

    Em geral, quando uma amostragem sem reposio, dizemos que a populao finita. Quando uma amostragem com reposio, ento dizemos que a populao infinita, pois a populao nunca ser exaurida. Para fins prticos a amostragem de uma populao finita muito grande pode ser considerada infinita.

    10.2 Distribuies amostrais Consideremos todas as amostras possveis de tamanho n que podem ser retiradas de uma populao dada (com ou sem reposio). Para cada amostra podemos calcular uma grandeza estatstica, por exemplo, a mdia. Deste modo obtemos a distribuio amostral da mdia. Da mesma forma podemos calcular a distribuio amostral do desvio padro, da varincia, das propores, ...

  • Prof. Cntia Paese Giacomello 57

    Distribuio amostral das mdias

    Uma distribuio amostral de mdias uma distribuio de probabilidade que indica quo provveis so diversas mdias amostrais. A distribuio funo da mdia, do desvio padro da populao e do tamanho da amostra. Para cada combinao da mdia, desvio padro e tamanho da amostra haver uma nica distribuio amostral de mdias.

    Sejam:

    x = mdia da populao =

    x = mdia da distribuio amostral x = desvio padro da populao =

    x = desvio padro da distribuio amostral N = tamanho da populao n = tamanho da amostra

    Admita-se que todas as amostras possveis de tamanho n sejam retiradas de uma populao finita de tamanho N>n. Ento:

    Populao Finita: =x e 1

    =

    NnN

    nx

    Se a populao for infinita, ou se amostragem for tomada com reposio, os resultados sero:

    Populao Infinita: =x e n

    x

    =

    A frmula do desvio padro nos diz que a quantidade de disperso na distribuio amostral depende de dois fatores:

    - a disperso da populao

    - o tamanho da amostra (utilizando raiz quadrada)

    Por exemplo, em qualquer populao, o aumento do tamanho das amostras extradas resultar em menor variabilidade entre as possveis mdias amostrais. E se o mesmo tamanho de amostra usado com diferentes populaes, as populaes com maior quantidade de disperso x tendero a gerar maior quantidade de variabilidade entre as mdias de amostras extradas delas.

    Para amostras grandes n>30 a distribuio amostral das mdias aproximadamente

    normal, com mdia x e desvio padro x , independente da populao, desde que a varincia e a mdia da populao sejam finitas e o tamanho da populao seja, no mnimo, o dobro da amostra. Este resultado para populao infinita um caso especial do

  • Prof. Cntia Paese Giacomello 58

    teorema do limite central da teoria avanada de probabilidade, que mostra que a preciso da aproximao melhora quando n cresce. Isto indicado, algumas vezes, dizendo-se que a populao assintoticamente normal. No caso da populao ser normalmente distribuda, a distribuio amostral das mdias tambm o ser, mesmo para pequenos valores de n (n

  • Prof. Cntia Paese Giacomello 59

    amostra. Alm disso vamos pressupor populao infinita, pois a produo de baterias no termina (teoricamente!)

    A soluo envolve a determinao do nmero de desvios padres que 49 e 51 distam da mdia (amostral).

    Determinemos primeiro o desvio padro da distribuio amostral:

    670364

    ,nx

    x ===

    para n=36

    Ento devemos trabalhar com x N(50;0,67)

    P(49< x

  • Prof. Cntia Paese Giacomello 60

    Distribuio amostral das propores

    Sendo a probabilidade de ocorrncia de um evento p (sucesso) e a probabilidade de no ocorrncia 1-p (fracasso).

    Consideram-se todas as amostras possveis de tamanho n de uma populao infinita e, para cada amostra, determina-se a proporo de sucessos. Assim obtm-se a distribuio amostral das propores.

    A mdia da distribuio amostral sempre igual proporo pp = onde

    p = proporo populacional

    p = mdia da distribuio amostral das propores Quando a populao muito grande ou infinita, o desvio padro da distribuio amostral se calcula

    n)p(p

    p

    =

    1

    e pode-se fazer uma aproximao para a distribuio normal quando n>30.

    Exemplos: Determine a mdia da distribuio de propores amostrais, quando a proporo na populao 72,3%

    p =p=72,3%

    Determine o desvio padro da distribuio amostral de propores para n=100 e uma proporo populacional de 60%

    0490100

    601601,

    ),(,n

    )p(pp =

    =

    =

    Verificou-se que 2% das ferramentas produzidas por uma certa mquina so defeituosas. Qual a probabilidade de que, em uma remessa de 400 dessas ferramentas, 3% ou mais revelarem-se defeituosas?

    p =p=0,02 en

    )p(pp

    =

    1 = 0070

    400980020

    ,,*,

    =

    Como n>30 pode-se utilizar a distribuio normal, ento

    P(p>0,03)=P( %,,),z(P),

    ,,z 6367076360431

    0070020030

    ==>=

    >

  • Prof. Cntia Paese Giacomello 61

    Exerccios:

    1. Determine a mdia da distribuio das propores amostrais quando a proporo na populao ....

    a. 30%

    b. 99%

    c. 54%

    2. Calcule o desvio padro da distribuio amostral de mdias para cada um dos seguintes casos:

    a. x=6, n=6

    b. x=6, n=20

    c. x=6, n=40

    d. x=6, n=100

    3. Certas vlvulas fabricadas por uma companhia tm vida mdia de 800 horas e desvio padro de 60 horas. Determinar a probabilidade de uma amostra aleatria de 16 vlvulas, retiradas do grupo, ter vida mdia a) entre 700 e 810 horas; b)inferior a 785 horas; c) superior a 820 horas; d) entre 770 e 830 horas.

    4. Um fabricante faz a remessa de 1000 lotes de 100 lmpadas eltricas cada um. Se 5% das lmpadas so normalmente defeituosas, em quantos lotes pode-se esperar que existam; a) menos de 90 lmpadas boas; b) 98 ou mais lmpadas boas

  • Prof. Cntia Paese Giacomello 62

    1111 EEssttiimmaaoo

    A estimao o processo que consiste em utilizar dados amostrais para estimar parmetros populacionais.

    As estatsticas amostrais so utilizadas como estimadores de parmetros populacionais. Assim, uma mdia amostral usada como estimativa da mdia populacional, a proporo de defeituosos de uma caixa utilizada para estimar a proporo de defeituosos na produo toda, etc.

    Tais estimativas chamam-se estimativas pontuais, porque originam apenas uma nica estimativa do parmetro. Em virtude da variabilidade amostral, usual incluir uma estimativa intervalar para acompanhar a estimativa pontual. Esta nova estimativa proporciona um intervalo, ou mbito, de possveis valores do parmetro populacional.

    Estimativa pontual: estimativa nica de um parmetro populacional

    Estimativa intervalar: intervalo de valores possveis, o qual se admite que esteja contendo o parmetro.

    Um intervalo de confiana d um intervalo de valores, centrado na estatstica amostral, no qual julgamos, com um risco conhecido de erro, estar o parmetro da populao.

    Exemplos: Tipo de estimativa Parmetro

    populacional Pontual Intervalar

    Mdia Um carro de motor 1.0 anda, em mdia, 14 km com um litro de combustvel

    Um carro de motor 1.0 anda, em mdia, entre 12 e 16 km com 1 litro de combustvel

    Proporo A proporo de peas defeituosas de 2%

    A proporo de peas defeituosas est entre 1,5 % e 2,5 %

    Desvio padro O desvio padro da temperatura numa piscina no aquecida da ordem de 2oC

    O desvio padro da temperatura numa piscina no aquecida est entre 1oC e 3 oC

    Os intervalos de confiana podem ser unilaterais (por exemplo, a proporo de defeitos maior de 3%) ou bilaterais (a proporo de defeitos est entre 2% e 4%).

  • Prof. Cntia Paese Giacomello 63

    A capacidade de estimar parmetros populacionais por meio de dados amostrais est ligada diretamente ao conhecimento da distribuio amostral da estatstica que est sendo usada como estimador.

    Os intervalos de confiana para os parmetros so construdos de forma que se considera uma variao em torno do valor amostral e, assim, pode-se escrever que o parmetro situa-se entre dois limites:

    Valor do parmetro = estimativa pontual erro de amostragem

    O erro de amostragem depende da distribuio amostral do parmetro, do nvel de confiana adotado e do tamanho da amostra.

    A tabela a seguir apresentada resume as informaes necessrias para intervalos de confiana.

    Populao

    Infinita Finita

    Estimativa de mdias

    Pontual x x

    Intervalar x conhecido

    nzx x

    1

    N

    nN

    nzx x

    x desconhecido

    n

    stx x

    1

    NnN

    n

    stx x

    Estimativa das propores

    Pontual p =

    nx

    p = nx

    Intervalar

    n)p(p

    zp

    1

    1

    1

    N

    nNn

    )p(pzp

    Onde:

    z representa o valor tabelado da distribuio Normal, com nvel de confiana .

    t representa o valor tabelado da distribuio t de Student, com nvel de confiana e GL graus de liberdade1

    N o tamanho da populao

    n o tamanho da amostra

    1 O valor da distribuio t de Student depende do nmero de graus de liberdade

  • Prof. Cntia Paese Giacomello 64

    Exemplo: Intervalo de confiana para a mdia quando se conhece a varincia de populao x

    Seja uma amostra de tamanho 36 de uma populao infinita, sabe-se que x=3 e x =24,2

    Confiana desejada

    Z (tabelado)

    Frmula Clculo E Intervalo

    90% 1,65 n

    zx x

    363651224 ,, 24,20,825 23,375 a 25,025

    95% 1,96 n

    zx x

    363961224 ,, 24,20,980 23,220 a 25,180

    99% 2,58 n

    zx x

    363582224 ,, 24,21,290 23,110 a 25,690

    Tamanho da amostra Uma das perguntas mais freqentes em estatstica : Qual o tamanho da amostra que devemos tomar?

    O tamanho da amostra depender do grau de confiana desejado (z), da quantidade de disperso entre os valores individuais (x), e de certa quantidade especfica de erro tolervel (e).

    O tamanho da amostra que voc afinal selecionar depender de seu oramento, da importncia econmica das decises e da

    variabilidade na populao. Desses trs problemas, dois so de ordem gerencial, cabendo a voc a deciso; apenas o terceiro

    (variabilidade) est fora do seu controle.(Brenda Landy, citada no livro Pesquisa de Marketing Naresh Malhotra. - 2001)

    A frmula do erro pode ser resolvida em relao a n. Assim, para o caso de estimao de mdias, tem-se:

    nze x

    =

    ezn x

    =

    2

    =

    ezn x

    E, para estimao de propores

    n

    p)p(1z e

    =

    2

    =

    n

    p)p(1z e2 2

    2

    e

    p)-p(1z n =

  • Prof. Cntia Paese Giacomello 65

    Que tamanho de amostra ser necessrio para produzir um intervalo de 90% de confiana para a verdadeira mdia da populao, com erro de 1,0 em qualquer dos sentidos, se o desvio padro da populao 10?

    Sabemos que x=10 e e=1 e queremos um intervalo 90% de confiana para a mdia, o que implica utilizar um valor de z=1,65.

    2

    =

    ezn x

    25272

    110651

    2

    ,,n =

    = tamanho da amostra 273.

    As companhias de seguro esto ficando preocupadas com o fato de que o nmero crescente de telefones celulares resulte em maior nmero de colises de carros. Esto, por isso, pensando em cobrar prmios mais elevados para os motoristas que utilizam celulares. Desejamos estimar, com uma margem de erro de trs pontos percentuais, a percentagem de motoristas que falam ao celular enquanto dirigem. Supondo que se pretende um nvel de confiana de 95% nos resultados, quantos motoristas devem ser investigados? Suponha que no tenhamos nenhuma informao sobre p.

    2

    2

    e

    p)-p(1z n = 11,1067

    03,96,

    == 2

    2

    00,5)-0,5(11

    n tamanho da amostra 1068.

    Exerccios:

    1. Os dados a seguir representam a temperatura coletada aleatoriamente em 15 cidades do estado. Determine o intervalo de confiana 90% para a temperatura mdia. No dispomos da varincia populacional, mas sabemos que a populao infinita. Dispomos apenas das seguintes informaes.

    23 40 30 21 34

    20 38 26 23 38

    33 32 24 21 24

    2. Uma amostra aleatria de 40 contas no comerciais na filial de um banco acusou saldo mdio dirio de R$ 140 com desvio padro de R$ 30.

    a. Construa um intervalo de 90% de confiana para a verdadeira mdia

    b. Construa um intervalo de 95% de confiana para a verdadeira mdia

    c. Construa um intervalo de 99% de confiana para a verdadeira mdia

  • Prof. Cntia Paese Giacomello 66

    3. Uma firma emprega diversos vendedores. Numa amostra aleatria de 15 notas de despesa numa semana de dezembro, um auditor constatou uma despesa mdia de R$ 220, com desvio padro de R$ 20.

    a. Qual a estimativa pontual da despesa mdia?

    b. Construa um intervalo de 99% de confiana para a quantia de despesa mdia por vendedor.

    c. Admitindo-se 200 vendedores, qual seria a estimativa pontual mdia para o total de despesas?

    d. Construa um intervalo de 99% de confiana para a quantia de despesa total.

    4. Uma amostra aleatria de 40 homens trabalhando num grande projeto de construo revelou que 6 no usavam capacetes protetores.

    a. Construa um intervalo de 95% de confiana para a verdadeira proporo dos que no esto utilizando capacetes neste projeto.

    b. Se h 1000 operrios no projeto, converta o percentual em nmero de capacetes necessrios para que todos estejam seguros.

    5. Uma amostra aleatria de 1000 fregueses da parte da manh de um supermercado revelou que apenas 10 no incluem leite em suas compras.

    a. Qual seria a