55
ESTATÍSTICA DESCRITIVA A Estatística surge da expressão em latim Statisticum Collegium, palestra sobre os assuntos do Estado, que envolvia a coleta e construção de tabelas de dados para os governos. A situação evoluiu e esta coleta de dados hoje representa somente um dos aspectos da Estatística. A Estatística é um conjunto de técnicas que permite, de forma sistemática, organizar, descrever, analisar e interpretar dados vindos de estudos ou experimentos, realizados em qualquer área do conhecimento. A Estatística aborda principalmente 3 grandes áreas: 1 - Estatística Descritiva 2 - Probabilidade 3 - Inferência Estatística A Estatística Descritiva é a etapa inicial da análise utilizada para descrever e resumir os dados. A disponibilidade de uma grande quantidade de dados e de métodos computacionais eficientes facilitou enormemente esta área da estatística. O objetivo da Estatística Descritiva é explorar as informações que podem informar características peculiares a um conjunto de dados. A teoria de probabilidades permite descrever os fenômenos aleatórios, ou seja, aqueles em que está presente a incerteza. Esta teoria está fundamentada em conceitos matemáticos bem estruturados e de grande utilidade para os resultados em Estatística. Finalmente, a Inferência Estatística é o estudo de técnicas que possibilitam a extrapolação a um grande conjunto de dados. O intuito é tirar informações obtidas a partir de uma pequena parte da população, denominada amostra e então formular conclusões. Arredondamento de números Segundo a ABNT-NBR 5891:1977 – Regras de arredondamento na numeração decimal, ao arredondar um número, deve-se seguir as seguintes regras: - O último algarismo de um número deve sempre ser acrescido de uma unidade caso o algarismo descartado seja superior a cinco (Ex: 235,8 236; 421,0012 421,001). - No caso do algarismo descartado ser igual a cinco, se após o cinco descartado existirem quaisquer outros algarismos diferentes de zero, o último algarismo retido será acrescido de uma unidade (Ex: 2,0502 2,1). - No caso do algarismo descartado ser igual a cinco, se após o cinco descartado só existirem zeros ou não existir outro algarismo, o último algarismo retido será acrescido de uma unidade somente se for impar (Ex: 2,3500 2,4; 2,25 2,2 ). Portanto, quando o primeiro algarismo a ser desprezado for 5 i) se a unidade a ser conservada for par, permanecerá par: 2,785 2,78 ii) se a unidade a ser conservada for ímpar, sofrerá arredondamento superior: 3,135 3,14 Notação: não confundir com que significa congruente

Apostila - Estatística Descritiva

Embed Size (px)

Citation preview

  • ESTATSTICA DESCRITIVA

    A Estatstica surge da expresso em latim Statisticum Collegium, palestra sobre os assuntos do Estado, que envolvia a coleta e construo de tabelas de dados para os governos. A situao evoluiu e esta coleta de dados hoje representa somente um dos aspectos da Estatstica.

    A Estatstica um conjunto de tcnicas que permite, de forma sistemtica, organizar, descrever, analisar e interpretar dados vindos de estudos ou experimentos, realizados em qualquer rea do conhecimento.

    A Estatstica aborda principalmente 3 grandes reas:

    1 - Estatstica Descritiva 2 - Probabilidade 3 - Inferncia Estatstica

    A Estatstica Descritiva a etapa inicial da anlise utilizada para descrever e resumir os dados. A disponibilidade de uma grande quantidade de dados e de mtodos computacionais eficientes facilitou enormemente esta rea da estatstica. O objetivo da Estatstica Descritiva explorar as informaes que podem informar caractersticas peculiares a um conjunto de dados.

    A teoria de probabilidades permite descrever os fenmenos aleatrios, ou seja, aqueles em que est presente a incerteza. Esta teoria est fundamentada em conceitos matemticos bem estruturados e de grande utilidade para os resultados em Estatstica.

    Finalmente, a Inferncia Estatstica o estudo de tcnicas que possibilitam a extrapolao a um grande conjunto de dados. O intuito tirar informaes obtidas a partir de uma pequena parte da populao, denominada amostra e ento formular concluses. Arredondamento de nmeros Segundo a ABNT-NBR 5891:1977 Regras de arredondamento na numerao decimal, ao arredondar um nmero, deve-se seguir as seguintes regras: - O ltimo algarismo de um nmero deve sempre ser acrescido de uma unidade caso o algarismo descartado seja superior a cinco (Ex: 235,8 236; 421,0012 421,001). - No caso do algarismo descartado ser igual a cinco, se aps o cinco descartado existirem quaisquer outros algarismos diferentes de zero, o ltimo algarismo retido ser acrescido de uma unidade (Ex: 2,0502 2,1). - No caso do algarismo descartado ser igual a cinco, se aps o cinco descartado s existirem zeros ou no existir outro algarismo, o ltimo algarismo retido ser acrescido de uma unidade somente se for impar (Ex: 2,3500 2,4; 2,25 2,2 ).

    Portanto, quando o primeiro algarismo a ser desprezado for 5 i) se a unidade a ser conservada for par, permanecer par: 2,785 2,78 ii) se a unidade a ser conservada for mpar, sofrer arredondamento superior: 3,135 3,14 Notao: no confundir com que significa congruente

  • [1]

    A assimilao das informaes geradas por dados de experimentos mais fcil quando as mesmas esto dispostas em tabelas e grficos.

    Uma tabela um arranjo sistemtico de dados numricos dispostos linhas e colunas para fins de comparao.

    Um grfico uma expresso visual dos dados ou valores numricos que se apresentam de maneiras diferentes e seu objetivo facilitar a compreenso dos mesmos.

    A apresentao em forma de tabelas e grficos devem expor os dados de modo fcil e que deixe a leitura mais rpida.

    APRESENTAO DE DADOS EM TABELAS

    As regras para a apresentao de tabelas segue a normatizao da NBR 14724 subitem 5.10,

    as quais sero confeccionadas seguindo as "NORMAS DE APRESENTAO TABULAR" aprovadas pela XVIII Assemblia Geral do Conselho Nacional de Estatstica, que constam no livro publicado pelo IBGE (ISBN 8524004711). O livro pode ser encontrado no endereo http://biblioteca.ibge.gov.br/visualizacao/monografias/GEBIS%20-%20RJ/normastabular.pdf Esquema Geral: Ttulo Varivel Frequncia % classe 1 F1 i1 classe 2 F2 i2 : : : classe k Fk ik TOTAL n 100 Fonte: Uma tabela estatstica deve ser auto-suficiente e deve apresentar: TTULO

    - Deve ser objetivo e claro. - colocado na parte superior da tabela. - Deve indicar:

    - a natureza do fato estudado (o que?) - as variveis escolhidas na anlise do fato (como?) - o local em que o mesmo foi observado (onde?) - a poca em que o mesmo foi observado (quando?)

    CABEALHO

    - a parte da tabela em que designada a natureza do contedo de cada coluna (a varivel, tipos de frequncias).

    Rodap

    Corpo

    Cabealho

  • [2]

    RODAP reservado para: Notas e Chamadas. Refere-se s observaes pertinentes.

    FONTE: Indica a entidade responsvel pela sua organizao ou fornecedora dos dados e ano da publicao ou observao do fato. Observaes: 1) Nenhuma "clula ou casela" deve ficar em branco, apresentando sempre um nmero ou sinal: - (hfen), quando o valor numrico nulo .... (reticncia), quando no se dispe de dado. ? (interrogao), quando h dvida quanto exatido do valor numrico. 0 (zero), quando o valor numrico muito pequeno para ser expresso pela unidade utilizada. 2) As tabelas devem ser fechadas no alto e embaixo por linhas horizontais. No sero fechadas, direita e esquerda, por linhas verticais. facultativo o emprego de traos verticais para a separao de colunas no corpo da tabela. 3) Os totais e subtotais sero destacados. 4) Em publicaes que compreendem muitas tabelas, estas devem ser numeradas em ordem crescente, conforme a ordem de aparecimento. Exemplo: Tabela 1.1 Populao Brasileira da Regio Sul em 1965 Estados Populao % Paran 7.000.000 43,75 Santa Catarina 3.000.000 18,75 R.G.do Sul 6.000.000 37,50 Total 16.000.000 100,00 Fonte: IBGE - 1967.

    Observaes: (1) Sempre que possvel, no quebrar a tabela. (2) Caso uma tabela ou quadro no caiba numa folha deve-se inserir a terminologia (continua) onde este aparecer pela primeira vez e deve-se repetir, na prxima folha, o ttulo da tabela (ex.: Tabela 1: Taxa de crescimento...) e o cabealho inserindo a terminologia (continuao), sendo que na folha onde finalizar a tabela ou quadro deve-se inserir a terminologia (concluso). Outrossim, caso uma tabela ou quadro possuir muitas linhas e pouca coluna, pode-se dispor em duas ou mais partes, sendo estas separadas por um trao duplo vertical

  • [3]

  • [4]

  • [5]

  • [6]

    Nota: Tabelas e Quadros apresentam um formato muito parecido, PORM so usados para armazenar informaes de tipos diferentes. As Tabelas armazenam informaes numricas e possuem as bordas laterais abertas, enquanto quadros armazenam informaes textuais (por exemplo, caractersticas, propriedades, relaes, etc.) e apresentam todas as bordas fechadas. O quadro usado para apresentar dados secundrios Exemplo: O IMC (ndice de Massa Corprea) reconhecido pela OMS como a principal referncia para classificao das diferentes faixas de peso.

    Resultado Situao Abaixo de 17 Muito abaixo do peso Entre 17 e 18,49 Abaixo do peso Entre 18,5 e 24,99 Peso normal Entre 25 e 29,99 Acima do peso Entre 30 e 34,99 Obesidade I Entre 35 e 39,99 Obesidade II (severa) Acima de 40 Obesidade III (mrbida)

    Ateno: O IMC no deve ser o nico parmetro para definir os riscos relacionados obesidade. Outros fatores, como circunferncia abdominal e taxa de colesterol, tambm so muito importantes.

    APRESENTAO GRFICA

    Os grficos permitem analisar grande quantidade de informaes de forma rpida e

    visualmente agradvel, sem que seja necessrio olhar tabelas e medidas resumo.

    Os grficos devem:

    ser auto-explicativos; ter sempre um ttulo, que ser colocado abaixo da figura; colocar a Fonte quando vindo de outro estudo; ser construdos em uma escala que no desfigure os fatos ou as relaes que se

    deseja destacar;

    Os grficos podem vir acompanhados de legenda, caso no fique explcito o nome da

    classe no grfico.

    As representaes grficas das tabelas de frequncias podem ser feitas atravs de

    diagramas (grficos construdos sobre o plano cartesiano) mapas e figuras geomtricas,

    unidimensionais ou bidimensionais.

  • [7]

    Os diagramas, histogramas e polgonos de frequncias so grficos representados sobre o

    primeiro quadrante de um sistema de eixos cartesianos. Representa-se no eixo y os valores das

    frequncias e no eixo x os valores da varivel (classes) em estudo.

    VARIVEL Qualquer caracterstica associada a uma populao. Em geral, a classificao de variveis

    so definidas como Qualitativa (Categrica) ou Quantitativa.

    Qualitativa Quantitativa

    Nominal Ordinal Discreta Contnua Genero

    cor dos olhos Nacionalidade

    Classe social grau de instruo grau de satisfao

    Nmero de filhos Nmero de carros

    Peso, altura, salrio, tempo de

    vida

    Apresentao dos Dados Qualitativos

    (I) Apresentao Tabular

    A constituio das classes imediata, j que a varivel apresenta modalidades de individualizao espontnea.

    As classes podem ser dispostas em ordem alfabtica ou, se desejar podero ser relacionadas em ordem crescente ou decrescente de frequncia. Exemplo

    Tabela 1 : Assistncia Federal em 1985 aos governos locais

    Auxlios Valores (em milhes de Dlares) %

    Sade 26.530 20,0 Educao 18.108 13,5 Transporte 18.075 13,5 Recursos Naturais 3.918 3,0 Outros 7.625 6,0 Assistncia Social 27.430 20,0 Assistncia Infncia 3.669 3,0 Habitao 6.156 5,0 Seguro Social 9.980 7,0 Geral 12.620 9,0 Total 134.111 100,0

    Fonte: IBGE - 1967

  • [8]

    (II) Apresentao Grfica

    Os principais grficos para as variveis qualitativas so: 1 - Diagrama de Barras 2 - Setograma (Pizza) 3 - Diagrama Linear 4 - Cartograma 5 - Outros ...

    Diagrama de Barras Objetivo: Mostrar de como se relacionam os valores da tabela a partir de dados observados. Construo: representado por retngulos dispostos verticalmente, com base no eixo horizontal e

    equidistantes.

    A separao entre qualquer dos retngulos deve ser menor do que a largura dos retngulos.

    Considerando-se bases de tamanhos iguais aos diversos retngulos, as alturas devem indicar as frequncias correspondentes. Cuidado: Ao usar um programa de computador para fazer os grficos, geralmente tem-se a opo de

    colocar o titulo acima do grfico e no segue a recomendao da ABNT.

    Sugesto: s vezes, por motivos de espao ou para facilitar a leitura, costuma-se usar grficos com as barras dispostas horizontalmente. Isto ocorre no caso de legendas muito extensas ou distribuio com muitas classes.

  • [9]

    Veja que no grfico acima, como os rtulos so muito extensos, aconselhvel colocar o grfico de barras na horizontal. Observe que para dados categricos nominais a ordem das variveis no importa, mas se forem dados ordinais, como por exemplo, opinio sobre o candidato X * * * * * * * * * * * * * * _______________________________________________________________

    odeio no gosto indiferente gosto amo Ateno: quando utilizado a varivel ano, por exemplo 1970, 1975, ... tem-se a impresso de ser um nmero, mas isto na verdade uma varivel qualitativa ordinal pois somente um posicionamento na poca em que ocorreu o evento. Posteriormente ser visto o diagrama linear que apropriado a esta situao. Existem outros tipos de grficos como este para variveis bidimensionais

  • [10]

    Cuidado com certas opes que o programa oferece, pois pode esconder detalhes importantes como o grfico a seguir que quase deixa uma das barras escondida e com dificuldade de ver com clareza a frequncia da barra que est atrs.

    Setograma (Pizza) Objetivo: Comparar cada valor da tabela com o total.

    Utiliza-se de preferncia para representar propores ou porcentagens. Construo: Consiste de um crculo dividido em setores, cujas reas so proporcionais s porcentagens dadas.

    Em geral, ilustrado com valores percentuais e no com valores absolutos. Para isso, preciso transformar os valores absolutos em porcentagens (%) utilizando-se a regra abaixo: 360 100% i

    Portanto, = 100

    360 i onde : ngulo do setor

    i : porcentagem correspondente classe da tabela

    Costuma-se colorir os setores de modo diferente, a fim de dar nfase aos tamanhos relativos de cada um. Observao: 1) Quando no puder utilizar o recurso de cores, por exemplo, uma impressora matricial ou laser ou mesmo se for reproduzir posteriormente como cpia, deve-se tomar o cuidado de colocar padres diferentes para que seja facilmente diferenciada.

  • [11]

    2) Pode-se destacar um setor especfico para dar um realce especial quela categoria. Por outro lado, se desmembrar todos os setores pode dificultar a visualizao ao invs de ressaltar.

    Diagrama Linear Objetivo: Mostrar a evoluo do fenmeno.

    empregado para representar tabelas temporais (dados dispostos por perodo de tempo). Construo: obtido marcando-se, no plano cartesiano, os pares ordenados dados pelas coordenadas tempo e frequncia observada correspondente, e a seguir ligando-se esses pontos por meio de uma linha (segmento).

    Este grfico precisa

    de ateno especial

    quando for usar a

    impresso

    monocromtica

  • [12]

    Cartograma Taxas Anuais de Migrao (por mil habitantes) nas Regies Administrativas do Estado de So Paulo - 1991/2000

    Fonte: Fundao IBGE. Fundao SEADE. Censos Demogrficos do Estado de So Paulo de 1991e 2000. Pictogramas

  • [13]

    numero do calcado dos alunos da 7 A

    Ateno especial neste pictograma!

    Note que a largura do lpis diferente para cada um.

    Portanto, a altura de cada lpis no pode ser interpretada

    como sendo a frequncia da preferncia de cor.

  • [14]

    2 - APRESENTAO DE DADOS QUANTITATIVOS

    Distribuio de Frequncia

    Os dados numricos podem ser representados numa tabela de forma agrupada, ou no, em

    intervalos.

    Costuma-se agrupar em intervalos os dados contnuos, porm, quando a amostra for pequena

    no recomendvel que os dados contnuos sejam agrupados.

    Por outro lado, quando a amostra de dados discretos apresentar um conjunto de valores

    distintos muito grande, recomendvel agrup-los em intervalos de classe.

    Exemplo: a) Dados no agrupados em intervalos

    Tabela 2.1: Nmero de Acidentes por dia na rodovia Dutra em Janeiro de 1977

    Nmero de acidentes/dia nmero de dias 0 1 2 3 4 5

    10 7 4 5 3 2

    Total 31 Fonte: DNER b) Dados agrupados em intervalos Tabela 2.2: Altura dos Alunos da classe em maro de 1977

    Alturas (m) Nmero de alunos 1.50 | 1.60 1.60 | 1.70 1.70 | 1.80 1.80 | 1.90

    5 15 17 3

    Total 40 Fonte: Secretaria da Escola Observao A notao a | b significa que o valor a est incluso neste intervalo e b no est incluso. Existem outras notaes para o agrupamento em intervalos, mas sero adotados neste curso somente a | b ou a | b.

  • [15]

    Agrupamento de Dados Quantitativos Sejam n o tamanho do conjunto de valores e k o nmero de intervalos. ROL: o arranjo dos dados (da amostra) em ordem crescente; simplesmente a ordenao crescente dos dados. CLASSE: um nico valor observado ou um intervalo representando os dados. FREQUNCIA ABSOLUTA SIMPLES DE UMA CLASSE ( Fi ) :

    o nmero de vezes que o elemento aparece na amostra ou nmero de elementos pertencentes a uma classe.

    =

    k

    iiF

    1 = n

    FREQUNCIA RELATIVA DE UMA CLASSE ( fi ):

    dada por fi = niF , para i = 1, 2, . . . , k

    e geralmente expressa em porcentagem.

    Observao: =

    k

    iif

    1 = 1.

    FREQUNCIA ACUMULADA DE UMA CLASSE ( Fac ):

    a soma das frequncias das classes anteriores at, e inclusive, a classe dada. FREQUNCIA RELATIVA ACUMULADA DE UMA CLASSE ( fac ):

    a soma das frequncias relativas das classes anteriores at, e inclusive, a classe dada. Exemplo: As notas de 32 estudantes de uma classe esto descritas a seguir: 6,0 0,0 2,0 6,5 5,0 3,5 4,0 7,0 8,0 7,0 8,5 6,0 4,5 0,0 6,5 6,0 2,0 5,0 5,5 5,0 7,0 1,5 5,0 5,0 4,0 4,5 4,0 1,0 5,5 3,5 2,5 4,5

  • [16]

    Tabela 2.3: Distribuio das notas dos estudantes

    notas Fi fi Fac 0,0 | 1,5 3 0,09375 3 1,5 | 3,0 4 0,12500 7 3,0 | 4,5 5 0,15625 12 4,5 | 6,0 10 0,31250 22 6,0 | 7,5 8 0,25000 30 7,5 | 9,0 2 0,06250 32 TOTAL 32 1

    Apresentao de Dados No Agrupados em Intervalos Neste caso, cada categoria ou classe corresponde a um determinado valor observado (valor da amostra), isto , identifica-se uma classe com um nico valor. Apresentao Tabular Ilustrao Numrica: Suponha que o interesse est no estudo do "nmero de dias de internao", de 20 pacientes em um hospital. Dados: 2 0 1 1 3 0 1 2 4 2 1 0 3 4 3 0 0 1 2 4 Rol: 0 0 0 0 0 1 1 1 1 1 2 2 2 2 3 3 3 4 4 4 Tabela 2.4: Distribuio do tempo de internao num hospital

    nmero de dias Fi fi Fac 0 5 0,25 5 1 5 0,25 10 2 4 0,20 14 3 3 0,15 17 4 3 0,15 20

    TOTAL 20 1 Fonte: SUS 1980 NOTA: Este tipo de tabela no aconselhvel quando se trabalha com amostras com um nmero de classes muito grande.

  • [17]

    Apresentao Grfica O objetivo do grfico o de produzir, no investigador ou no pblico em geral, uma impresso mais rpida e atrativa do fenmeno em estudo. O grfico deve apresentar a forma da distribuio, as medidas de posio e disperso do fenmeno em estudo. I - Grfico em Basto

    Para sua construo, marcam-se no eixo das abscissas do sistema de coordenadas cartesianas, os pontos referentes s classes da distribuio de frequncias.

    Nestes pontos, constroem-se segmentos de retas perpendiculares ao eixo cujos comprimentos sejam iguais s frequncias (absolutas ou relativas) de cada classe da tabela.

    Os pontos no podem estar muito prximos porque a leitura do grfico deve tornar claro que no h continuidade entre os valores individuais assumidos pela varivel em estudo. II - Grfico de Frequncia Acumulada

  • [18]

    Apresentao de Dados Agrupados em Intervalos Apresentao Tabular A Distribuio de Frequncias para dados agrupados em intervalos de classe segue a proposta dada por Herbert Sturges (1926), considerado um idealizador do diagrama de frequncias com k barras,

    no qual a contagem da i-sima barra dada pelo coeficiente binomial

    ik 1

    , i = 0, 1, . . . , k 1.

    medida que k aumenta, o diagrama de frequncias se aproxima da forma de uma densidade normal. O tamanho da amostra total

    n = =

    1

    0

    1k

    i ik

    = (1 + 1)k 1 = 2 k 1

    pela expanso da binomial. Assim, o numero de classes a ser determinado pela construo do diagrama de barras para dados de uma normal k = 1 + log2(n).

    Lembrando que a regra para a mudana de base log b(a) = )(log)(log

    ba

    c

    c ,

    log2(n) = )2(log)(log

    10

    10 n = 0,30103

    )(log10 n = 3,321928 log10(n)

    ou

    log2(n) = )2ln()ln(n =

    0,6931472)ln(n = 1,442695 ln(n).

    Regras Gerais 1) Ordenar os dados. 2) Determinar o valor de R (chamado de amplitude), que determinado por

    R = maior valor observado - menor valor observado. 3) Determinar o valor de k, o nmero de intervalos, atravs da frmula de Sturges:

    k 1 + 3,322 log10(n) Observao: Como k deve ser um nmero inteiro, use o arredondamento usual.

    4) Calcular a amplitude intervalar h , que o tamanho de cada intervalo: h R/k Observao: h sempre segue um arredondamento superior e deve respeitar o numero de casas

    decimais dos valores observados. 5) Calcular Fi , fi , para i = 1, . . . , k e Fac para cada intervalo.

  • [19]

    Ilustrao Numrica: Considere uma amostra de 14 recm-nascidos, onde se observou o peso (kg): 4,2 3,7 2,5 2,8 3,0 2,2 3,5 3,7 2,1 4,3 2,4 2,7 2,4 3,3 Arranjar os dados numa Distribuio de Frequncias. Soluo: Rol: 2,1 2,2 2,4 2,4 2,5 2,7 2,8 3,0 3,3 3,5 3,7 3,7 4,2 4,3 R = 4,3 2,1 = 2,2

    n = 14

    k 1 + 3,322*log10(14) = 1 + 3,322*(1,146128) = 4,8 => k = 5 h 2,2 / 5 = 0,44 => h = 0,5 (arredondamento superior e 1 casa decimal) Distribuio dos Pesos de Recm-Nascidos

    Pesos Fi fi Fac 2,1 | 2,6 5 0,36 5 2,6 | 3,1 3 0,21 8 3,1 | 3,6 2 0,14 10 3,6 | 4,1 2 0,14 12 4,1 | 4,6 2 0,14 14 TOTAL 14 1

    Observaes: 1) As classes devem ser mutuamente exclusivas e exaustivas; 2) Devem ser evitadas classes do tipo "40 anos e mais", "menores de 20 anos"; 3) Deve-se, sempre que possvel, utilizar intervalos com tamanhos iguais, o que permite uma

    comparao adequada das frequncias dos intervalos; 4) Deve ser expresso com um nmero de casas decimais no superior ao nmero de casas dos

    dados, isto , se os dados tm 3 casas decimais, pode ter no mximo 3 casas decimais; 5) Os dados agrupados passam a assumir o valor mdio do intervalo. Portanto, quanto maior for o

    tamanho do intervalo, menor preciso se obter do fenmeno analisado (isto , maiores sero as possibilidades de distoro na anlise estatstica);

    6) O processo de agrupamento em intervalos, geralmente inutiliza muitos detalhes originais dos

    dados. Se no obedecer a um critrio para construo, as medidas descritivas (que sero vistas a seguir) podem distorcer muito dos dados coletados. Sua vantagem est no aspecto global obtido.

  • [20]

    Apresentao Grfica I - Ramo e folhas O ramo-e-folhas uma representao grfica dos nmeros no qual organiza os dados de forma a ressaltar algumas caractersticas do conjunto de dados, tais como:

    Forma da distribuio (simetria/assimetria) Disperso Existncia de valores discrepantes (outliers) Existncia de lacunas entre os dados

    Outra caracterstica do ramo-e-folhas o fato ter o aspecto semelhante ao histograma, tendo a vantagem de exibir o formato da distribuio sem que haja perda de informao. A desvantagem do ramo-e-folhas est no fato de ser um grfico apropriado para ser utilizado com conjuntos dados de tamanho pequeno. Exemplo 1: Dados: 2,5 2,6 2,5 2,4 5,4 8,8 12,3

    Unidade das folhas = 0,1

    Ramos Folhas 258

    12

    4 5 5 6 4 8 3

    Exemplo 2: Dados: 56 62 63 65 65 65 68 70 72 Unidade das folhas = 1

    Ramos Folhas 567

    6 2 3 5 5 5 8 0 2

    II - Histograma Consiste de um conjunto de retngulos justapostos que tem:

    i) as bases sobre um eixo horizontal (eixo das abscissas) com centro no ponto mdio dos intervalos e as larguras iguais s amplitudes dos intervalos;

    ii) cada retngulo do Histograma tem altura dada por:

    altura do retngulo = Fi / hi . Se todos os intervalos tiverem a mesma amplitude, toma-se simplesmente as alturas dos retngulos numericamente iguais s frequncias dos intervalos.

  • [21]

    Exemplo Idade dos alunos da Escola

    Idade Fi 2 | 4 4 | 6 6 | 8 8 | 10 10 | 12

    3 5 10 6 2

    Total 26 III - Polgono de Frequncia Consta de um polgono cujos vrtices so obtidos pela interseco de cada ponto mdio do intervalo e sua respectiva frequncia. Exemplo:

  • [22]

    Nota: Acrescentam-se os segmentos PQ e RS que vo at os pontos mdios dos intervalos imediatamente inferior e superior e cujas frequncias so nulas. O acrscimo desses segmentos PQ e RS faz com que a rea total delimitada pelo polgono e o eixo das abscissas seja proporcional frequncia total da distribuio. Observao: O Polgono de Frequncia tambm pode ser obtido ligando-se os pontos mdios dos topos dos retngulos de um histograma. Neste caso, necessrio o acrscimo dos segmentos PQ e RS, para que a soma das reas dos retngulos do histograma seja igual rea total limitada pelo polgono de frequncia e o eixo das abscissas. IV - Ogiva de Galton (Polgono de Frequncia Acumulada) til para determinao das medidas separatrizes (mediana, quartil, decil etc.). A Ogiva a representao grfica da frequncia acumulada de uma distribuio de frequncias. uma poligonal que parte do limite inferior do primeiro intervalo e para cada limite superior indica a frequncia acumulada do intervalo. Exemplo:

    Idade Fi Fac fi fac 2 | 4 4 | 6 6 | 8 8 | 10 10 | 12

    3 5 10 6 2

    3 8 18 24 26

    0,1154 0,1923 0,3846 0,2308 0,0769

    0,1154 0,3077 0,6923 0,9231 1,0000

    Total 26

  • [23]

    MEDIDAS DESCRITIVAS

    O objetivo das medidas descritivas descrever um conjunto de dados quantitativos de forma

    compacta e organizada. Cabe ressaltar que as medidas vistas nesta etapa no podem ser levadas para

    fazer inferncia para a populao, so meramente para descrever o aspecto geral de um conjunto de

    observaes.

    As principais medidas que sero abordadas so as medidas de:

    A) Posio (Tendncia Central e Separatrizes) B) Disperso C) Forma (Assimetria e Curtose)

    No estudo das medidas descritivas, sero distinguidos sempre o fato dos dados estarem

    tabelados ou no-tabelados e agrupados ou no-agrupados em intervalos de classe.

    A) Medidas de Posio Tais medidas orientam-se quanto posio da distribuio no eixo das abscissas, possibilitando que dois ou mais conjuntos de dados sejam comparados entre si pelo confronto desses nmeros. As medidas de tendncia Central de maior uso so:

    i) mdia aritmtica ii) mediana iii) moda

    Outra medida de posio bastante til so as separatrizes (quartis, decis, percentis etc.) i) MDIA ARITMTICA

    Sejam x1, x2, ... , xn os dados amostrais e n o tamanho da amostra.

    A MDIA ARITMTICA X dos valores x1, x2, ... , xn definida por:

    X = =

    n

    iixn 1

    1

    Exemplo: Sete alunos foram escolhidos, ao acaso, em uma escola, onde se observou o nmero de dias que estes faltaram em um ano, obtendo o seguinte resultado: 1 8 4 5 4 3 2 Calcule a mdia aritmtica X (o nmero mdio de faltas). Soluo:

    X = =

    7

    171

    iix = (1 + 8 + 4 + 5 + 4 + 3 + 2)/7 = 27/7 = 3,857143 4

    X = 4 dias Portanto, o tempo mdio de faltas na escola de 4 dias.

  • [24]

    Quando os dados forem apresentados em uma tabela tal como

    Varivel Frequncia x1 F1 x 2 F2 : : xk Fk

    TOTAL n A mdia aritmtica pode ser calculada com a seguinte formula:

    X = =

    n

    iiixn 1

    F 1

    Exemplo: A numerao dos calados dos alunos de uma classe est disposta na tabela abaixo

    Nmero do calado Frequncia 34 2 35 12 36 19 37 12 38 18 39 25 40 22 41 21 42 16 43 2 44 1

    TOTAL 150

    X = =

    n

    iiixn 1

    F 1 = 34(2) + 35(12) + 36(19) + 37(12) + 38(18) + 39(25) + 40(22) + 41(21) + 42(16) +

    + 43(2) + 44(1) =

    = (68 + 420 + 684 + 444 + 684 + 975 + 880 + 861 + 672 + 86 + 44)/150 = 38,79 Propriedades da mdia P1 - A soma dos desvios em relao a mdia nula; P2 - A mdia de uma constante igual constante; P3 - A mdia do produto de uma constante por uma varivel igual ao produto da constante pela

    mdia da varivel; P4 - A soma dos quadrados dos desvios em relao a mdia um mnimo. Observaes Gerais: A mdia aritmtica de um conjunto de dados:

    1) tem a mesma medida de mensurao da varivel considerada; 2) sempre existe e nica (assume um nico valor); 3) sofre muito a influncia de valores extremos (muito grandes ou muito pequenos).

  • [25]

    ii) MEDIANA (Med ou Md) A Mediana o valor central de um rol, ou seja, a medida que divide o rol em duas partes iguais, deixando 50% dos valores abaixo dessa medida e 50% dos valores acima dessa medida. i) Quando n mpar: a mediana um valor que pertence ao rol. ii) Quando n par: a mediana a mdia dos dois valores centrais. Exemplos: 1) Considere os dados 1 8 4 5 4 3 2

    Rol: 1 2 3 4 4 5 8

    Como n = 7 mpar, ento o elemento que divide o rol em duas partes iguais Med = 4.

    2) Os dados abaixo representam os tempos de sobrevivncia (mdia) de 6 cobaias submetidas a um experimento mdico:

    3 15 46 64 126 623

    Rol: 3 15 46 64 126 623

    Como n = 6 par, ento o elemento que divide o rol em duas partes iguais

    Med = ( ) ( )2

    43 xx + = 2

    6446 + = 55 Observaes Gerais:

    1) A mediana no afetada pela grandeza dos valores extremos (aberrantes) e sim pelo nmero de elementos da amostra;

    2) Se a distribuio assimtrica, muitas vezes, a mediana uma medida de posio que melhor representa o conjunto de dados do que a mdia aritmtica;

    3) Sua grande desvantagem reside no fato de no poder ser tratada algebricamente. iii) MODA (Mo) A MODA de um conjunto de dados amostrais o valor (ou valores) mais frequentes no rol. Observao: 1) Pode haver mais de uma moda. 2) Se todos os valores distintos tm a mesma frequncia, o conjunto de dados no tem moda.

  • [26]

    Exemplos:

    i) 10 10 12 13 18 Mo = 10 (conjunto unimodal) ii) 100 100 200 200 300 600 Mo = 100 e Mo = 200 (conjunto bimodal) iii) (a) 1 2 3 4 5 6 / Mo (conjunto amodal) (b) 1 1 3 3 5 5 / Mo (conjunto amodal) Nota

    1) O fato de um conjunto de dados apresentar mais de uma moda pode ser um indcio de heterogeneidade dos dados.

    2) Um aspecto importante a ressaltar que se pode distinguir as flutuaes acidentais (outliers) da

    amostra dos verdadeiros valores modais. QUAL MEDIDA DE TENDNCIA CENTRAL UTILIZAR?

    Tendo a mdia, a mediana e a moda o mesmo objetivo, em que condies recomendvel

    empregar cada uma dessas medidas?

    A mdia aritmtica , de longe, a mais usada dentre as estatsticas de tendncia central, mas

    nem sempre ela quem melhor representa um conjunto de dados. Por exemplo, suponha que o

    conjunto de dados seja 1, 1, 1, 1, 1, 2, 2, 2, 2, 20.

    A mdia aritmtica X = 3,3 enquanto a mediana Med = 1,5 , o que bem mais

    representativo, dado que a maior parte das observaes 1 ou 2.

    O fato que a mdia aritmtica muito influenciada por valores extremos, tal como 20 no

    exemplo dado, enquanto que a mediana no afetada por esses valores extremos.

    Quando o tamanho da amostra grande, esta desvantagem da mdia torna-se menos

    importante.

    A propsito de anlises estatsticas, a mdia apresenta, sobre a mediana, a vantagem de ser

    mais fcil de manipular algebricamente.

    A moda a menos empregada quando se trata de um conjunto de dados sem o agrupamento.

    Um confronto mais acirrado necessita do conceito de robustez, que infelizmente, no cabe no

    presente estudo.

  • [27]

    iv) SEPARATRIZES

    As separatrizes so valores que separam o rol (os dados ordenados) em partes iguais. Os QUARTIS dividem em quatro partes, os DECIS em dez, PERCENTIS ou CENTIS em cem etc. Para determinar essas separatrizes, exige-se primeiramente que os dados estejam organizados em ordem crescente. Quartis ( Qi ): So os 3 valores que dividem o conjunto de dados ordenados (rol) em 4 (quatro) partes iguais. Primeiro Quartil ( Q1 ) - valor situado na srie de dados de tal modo que 25% das observaes so

    menores que ele e 75% so maiores. Segundo Quartil ( Q2 ) - valor situado na srie de dados de tal modo que 50% das observaes so

    menores que ele e 50% so maiores. O segundo quartil o mesmo que a mediana. Terceiro Quartil (Q3 ) - valor situado na srie de dados de tal modo que 75% das observaes so

    menores que ele e 25% so maiores.

    | 25% | 25% | 25% | 25% | Q1 Q2 Q3 Exemplo 1: Calcule os quartis da srie: { 5, 2, 6, 9, 10, 13, 15 }

    O primeiro passo a ser dado a ordenao (crescente ou decrescente) dos valores:

    2 5 6 9 10 13 15

    O valor que divide a srie acima em duas partes iguais o 9, logo a Md = 9 = Q2. Tem-se agora {2, 5, 6 } e {10, 13, 15 } como sendo os dois grupos de valores iguais proporcionados pela mediana (2 quartil). Para o clculo do 1 quartil e 3 quartil (Q1 e Q3) basta calcular as medianas das partes iguais provenientes da verdadeira Mediana da srie (Q2).

    2 5 6 10 13 15

    Logo, em { 2, 5, 6 } a mediana 5, ou seja, o 1 quartil (Q1) ser 5.

    Em {10, 13, 15 } a mediana 13, ou seja, o 3 quartil (Q3) ser 13. Exemplo 2: Calcule os quartis da srie: { 1, 1, 2, 3, 5, 5, 6, 7, 9, 9, 10, 13 } A srie j est ordenada, ento

    1 1 2 3 5 5 6 7 9 9 10 13 O 2 Quartil = Md = (5 + 6)/2 = 5,5 O 1 quartil (Q1) ser a mediana da srie esquerda de Md,

    1 1 2 3 5 5 6 7 9 9 10 13

  • [28]

    Q1 = (2 + 3)/2 = 2,5 O 3 quartil (Q3) ser a mediana da srie direita de Md, Q3 = (9+9)/2 = 9 Decis ( Di ): So os 9 valores que dividem o rol em 10 (dez) partes iguais. Primeiro Decil ( D1 ) - valor situado na srie de dados de tal modo que 10% das observaes so

    menores que ele e 90% so maiores. Segundo Decil ( D2 ) - valor situado na srie de dados de tal modo que 20% das observaes so

    menores que ele e 80% so maiores. ... Nono Decil ( D9 ) - valor situado na srie de dados de tal modo que 90% das observaes so

    menores que ele e 10% so maiores.

    | 10% | 10% | 10% | 10% | 10% | 10% | 10% | 10% | 10% | 10% | D1 D2 D3 D4 D5 D6 D7 D8 D9 Percentis ( Pi ) ou Centis ( Ci ): So os 99 valores que dividem o rol em 100 (cem) partes iguais. Primeiro Percentil ( C1 ) - valor situado na srie de dados de tal modo que 1% das observaes so

    menores que ele e 99% so maiores. Segundo Percentil ( C2 ) - valor situado na srie de dados de tal modo que 2% das observaes so

    menores que ele e 98% so maiores. ... Nonagsimo Nono Percentil ( C99 ) - valor situado na srie de dados de tal modo que 99% das

    observaes so menores que ele e 1% so maiores.

    | 1% | 1% | 1% | ... | 1% | 1% | 1% | C1 C2 C3 C97 C98 C99 B) Medidas de Disperso (ou de Variabilidade)

    Os mtodos estatsticos do especial nfase ao estudo da variao, pois uma medida de

    posio, como a mdia por exemplo, por si s insuficiente para descrever a caracterstica de um

    conjunto de dados. Note que dois conjunto de dados podem ter a mesma mdia, mas diferir muito

    no grau de variao de seus valores. Por exemplo, considere trs amostras: (a) 4, 4, 4, (b) 3, 4, 5 e

    (c) 0, 4, 8. Todas as trs amostras tm a mesma mdia, ou seja, X = 4; mas na amostra (a) no

  • [29]

    existe variao alguma e a variao em (c) maior do que em (b). So, portanto, trs amostras de

    caractersticas diferentes.

    As medidas de disperso (ou medidas de variabilidade) so medidas que permitem quantificar

    a variao, ou ainda o grau de afastamento (espalhamento), dos dados em torno da mdia ou

    qualquer outro ponto especificado.

    As medidas de disperso mais conhecidas so:

    i) Amplitude

    ii) Desvio mdio

    iii) Varincia

    iv) Desvio padro

    v) Coeficiente de Variao

    Observao: De modo geral, considerando a variabilidade em torno de cada medida de posio, as medidas de disperso servem para verificar a representatividade destas medidas. Considere X = { x1, x2, ... , xn } os dados amostrais e n o tamanho da amostra.

    i) Amplitude (H)

    a diferena entre o maior e o menor valor do conjunto.

    H = Max(X) Min(X).

    Sendo a mais simples das medidas de disperso e de grande instabilidade, porque considera

    somente os valores extremos do conjunto. Tambm chamada de desvio extremo.

    ii) Desvio Mdio (Dm)

    a mdia aritmtica dos valores absolutos dos desvios tomados em relao mdia (ou

    mediana).

    Sendo di o desvio dos valores x1, x2, ... , xn em relao media x , ento Dm definido por:

    Dm = =

    n

    iidn 1

    ||1 = =

    n

    ii xxn 1

    1

    iii) Varincia

    Seja x1, x2, ... , xn um conjunto de dados com mdia x = =

    n

    iixn 1

    1 . Define-se VARINCIA por:

  • [30]

    S2 = n1

    =

    n

    ii xx

    1

    2)(

    Uma frmula anloga para S2 = n1

    ==n

    i

    n

    ii

    i n

    xx

    1

    2

    12 = n1

    =

    n

    ii xnx

    1

    22 .

    Propriedades da Varincia P1 - A varincia de uma constante zero; S2(k) = 0 P2 - A varincia da soma ou diferena de uma constante k com uma varivel igual a varincia da

    varivel; S2(X + k) = S2(X)

    P3 - A varincia da soma de variveis independentes igual a soma das varincias das variveis;

    S2(X + Y) = S2(X) + S2(Y)

    P4 - A varincia do produto de uma constante por uma varivel igual ao produto do quadrado da constante pela varincia da varivel;

    S2(k.X) = k2. S2(X); iv) Desvio-Padro (S) Define-se DESVIO-PADRO (S) como sendo a raiz quadrada positiva da varincia (S2).

    S = 2S S uma das medidas mais teis da variao, pois como ela expressa na mesma unidade dos dados, sua interpretao direta. Especialmente para (n 30) tem-se:

    68% das observaes estaro entre x S 95% das observaes esto entre x 2S praticamente 100% esto entre x 3S

    Observaes: 1) Por definio S e S2 so no-negativos e podem assumir qualquer valor maior ou igual a zero. O

    valor "zero" obtido quando todos os dados tm o mesmo valor, isto , quando no h variao alguma entre os valores dos dados.

    2) O desvio-padro tem as mesmas propriedades que a varincia, porm a varincia tem a dimenso

    quadrtica dos dados. Exemplo: Para a seguinte amostra: 12 5 10 8 15 tem-se Rol: 5 8 10 12 15

  • [31]

    Amplitude H = 15 5 = 7

    Mdia x = 51 (5 + 8 + 10 + 12 + 15) = 50/5 = 10

    x | d | x2 5 5 25 8 2 64 10 0 100 12 2 144 15 5 225 50 14 558

    Desvio Mdio Dm = 51 (14) = 2,8

    Varincia usando S2 = n1

    ==n

    i

    n

    ii

    i n

    xx

    1

    2

    12 tem-se

    S2 = 51

    550558

    2= 11,6

    Portanto, o desvio padro S = 6,11 = 3,4. Nota: O desvio mdio preferido em relao ao desvio padro, quando esse for indevidamente

    influenciado pelos desvios extremos. v) Coeficiente de Variao (CV) O Coeficiente de Variao de PEARSON uma medida relativa que determina o grau de concentrao dos dados em torno da mdia.

    definida por CV = xS , no qual S o desvio-padro e x a mdia.

    Quanto menor o CV mais representativa ser a mdia do processo. Observao.: O CV independe das unidades em que foram medidos os dados e/ou independe do tamanho da amostra.

  • [32]

    Aplicao: O coeficiente de variao uma medida valiosa para comparar a variao (o grau de homogeneidade) entre dois conjuntos de dados (duas distribuies de Frequncias) medidos em unidades diferentes. Ou ainda, quando apresentam mdias diferentes, embora suas unidades de medidas sejam iguais. Exemplo: Suponha que determinado fornecedor "A" de papeletas tenha enviado ao Departamento de Compras de uma empresa uma amostra de 2000 papeletas, de comprimento variando entre 101 e 113 mm. Um fornecedor "B" apresentou um lote deste mesmo tipo de papeletas com o mesmo nmero de peas. Efetuaram uma anlise e encontrou-se:

    Fornecedor Comprimento mdio de papeletas (mm)

    Desvio-padro do comprimento (mm)

    A 107,9 2,72 B 108,0 1,08

    Qual o lote que voc escolheria se fosse o comprador?

    Soluo: Aplicando-se o CV = xS , tem-se:

    - para o fornecedor A, CVA = 2,72/107,9 = 0,0252 ou 2,52% - para o fornecedor B, CVB = 1,08/108 = 0,01 ou 1% Pelos resultados, o lote do fornecedor (B) apresenta menor CV do que o lote do fornecedor (A). Logo, o lote escolhido seria do fornecedor (B).

    RELAO ENTRE AS MEDIDAS DE VARIABILIDADE

    DE DUAS DISTRIBUIES DISTINTAS

    Examinando a figura ao lado pode-se afirmar que: a) o desvio-padro da distribuio A maior

    do que o da distribuio B, isto , SA > SB; b) as mdias so iguais, isto , x A = x B. c) o coeficiente de variao da distribuio A

    maior do que o da distribuio B, isto , CVA > CVB.

  • [33]

    C) Medidas de Forma Complementam as medidas de posio e de disperso, proporcionando uma descrio e compreenso mais completa das distribuies de frequncias. Estas medidas trazem informaes quanto a forma da distribuio dos dados. Os coeficientes que sero determinados a seguir, utilizam uma medida chamada MOMENTO, que fornece uma ideia da tendncia central, disperso e assimetria de uma distribuio de probabilidades. i) Momentos So medidas de carter mais geral e do origem s demais medidas descritivas, como as de tendncia central, disperso, assimetria e curtose. Conforme a potncia considerada tem-se a ordem ou o grau do momento calculado. Momentos simples ou centrados na origem (mr)

    mr = n1

    =

    n

    i

    riX

    1 r um nmero inteiro positivo e define a ordem do momento.

    Para r = 0 tem-se m0 = 1

    Para r = 1 tem-se m1 = n1

    =

    n

    iiX

    1 mdia aritmtica

    Momentos centrados na mdia (Mr)

    Mr = n1 ( )

    =

    n

    i

    ri XX

    1

    Para r = 0 tem-se M0 = 1

    Para r = 1 tem-se M1 = 0

    Para r = 2 tem-se M2 = ( )=

    n

    ii XX

    1

    2 varincia (S2)

    ii) Assimetria

    Assimetria o grau de desvio, afastamento da simetria ou grau de deformao de uma distribuio de frequncias. Esta medida mostra como os dados se comportam em relao a ordenada mxima. Tipos de curvas

    Curva assimtrica negativa

    (a maioria dos dados est a esquerda da moda)

    Curva Simtrica

    Curva assimtrica positiva

    (a maioria dos dados est a direita da moda)

  • [34]

    Coeficiente de assimetria de Pearson As = SMoX

    Se As < 0 a curva ser assimtrica negativa Se As > 0 a curva ser assimtrica positiva Se As = 0 a curva ser simtrica

    Coeficiente momento de assimetria 3 = 33SM

    Se | 3 | < 0,2 a curva ser simtrica Se 0,2 < | 3 | < 1,0 a curva ser assimtrica fraca Se | 3 | > 1,0 a curva ser assimetria forte.

    1 Coeficiente de assimetria +1 Relao entre Mdia, Mediana e Moda

    Distribuio assimtrica esquerda

    Distribuio simtrica

    Distribuio assimtrica direita iii) Curtose

    Curtose um indicador do achatamento da curva da distribuio de frequncia dos dados em relao a uma distribuio padro. As medidas de Curtose ou de Achatamento mostram at que ponto uma distribuio a mais aguda ou a mais achatada do que uma curva normal, de altura mdia.

    Valores mais altos significam curvas mais afuniladas e valores mais baixos significam curvas mais achatadas. A denominao usual passa a ser excesso de curtose.

    Coeficiente centlico de curtose K = ( )1913

    2 DDQQ

    Se K = 0,263 a curva ser mesocrtica Se K < 0,263 a curva ser leptocrtica Se K > 0,263 a curva ser platicrtica

    Coeficiente momento de curtose: definida pela relao entre o momento central de quarta ordem e o quadrado do momento central de segunda ordem (ou o desvio-padro elevado a quatro)

  • [35]

    4 = 44SM

    Se 4 = 3 curva mesocrtica; Se 4 < 3 curva platicrtica; Se 4 > 3 curva leptocrtica.

    Tipos de curvas

    (a) Leptocrtica (b) Mesocrtica (c) Platicrtica Exemplo: Para a seguinte amostra: 5 8 8 12 17 tem-se x = 10 , Mo = 8 ,

    S2 = 51

    ==n

    i

    n

    ii

    i n

    xx

    1

    2

    12 = 51 [586 502/5] =

    51 [586 500] = 86/5 = 17,2 e S = 4,1473

    Assimetria As = SMoX = (10 8)/4,1473 = 0,4822428 => Assimetria positiva

    3 = 33SM = 42/(4,64)3 = 0,5888 pois M3 = (1/5)[ (-125)+ (-8) + (-8) + 8 + 343] =

    210/5 = 42

    Curtose K = ( )1913

    2 DDQQ questionvel neste caso, pois n = 5

    4 = 44SM = 2,078150 =>

    M4 = (1/5)[ 625 + 16 + 16 + 16 + 2401] = 3074/5 = 614,8

  • [36]

    E X E R C C I O : Um dado foi lanado 50 vezes e foram registrados os seguintes resultados

    5 4 6 1 2 5 3 1 3 3 4 4 1 5 5 6 1 2 5 1 3 4 5 1 1 6 6 2 1 1 4 4 4 3 4 3 2 2 2 3 6 6 3 2 4 2 6 6 2 1

    Fazer a apresentao tabular, a apresentao grfica e calcular as medidas descritivas E X E R C C I O : Dado o rol de medidas das alturas (dadas em cm) de uma amostra de 100 indivduos de uma faculdade:

    151 152 154 155 158 159 159 160 161 161 161 162 163 163 163 164 165 165 165 166 166 166 166 167 167 167 167 167 168 168 168 168 168 168 168 168 168 168 169 169 169 169 169 169 169 170 170 170 170 170 170 170 171 171 171 171 172 172 172 173 173 173 174 174 174 175 175 175 175 176 176 176 176 177 177 177 177 178 178 178 179 179 180 180 180 180 181 181 181 182 182 182 183 184 185 186 187 188 190 190

    Calcule:

    a) a amplitude amostral;

    b) o nmero de classes;

    c) a amplitude de classes;

    d) os limites de classes;

    e) as frequncias absolutas da classes;

    f) as frequncias relativas;

    g) os pontos mdios da classes;

    h) as frequncias acumuladas;

    i) o histograma e o polgono de frequncia;

    j) o polgono de frequncia acumulada;

    Faa comentrios sobre os valores das alturas desta amostra atravs da distribuio de frequncia.

  • [37]

    MEDIDAS DESCRITIVAS PARA DADOS AGRUPADOS EM INTERVALOS I - MEDIDAS DE POSIO A. Mdia Aritmtica Suponha que os dados amostrais sejam apresentados segundo a seguinte distribuio de frequncias:

    varivel Frequncia a1 | a2 F1 a2 | a3 F2

    : : ak | ak+1 Fk

    Total n

    A MDIA ARITMTICA X definida por: X = =

    k

    iiiFPmn 1

    1 , no qual Pmi o ponto mdio do

    intervalo a i | a i + 1 , isto , X = nFPmFPmFPm kk+++ L2211 .

    Exemplo: Considere uma amostra de 50 recm-nascidos, onde se observou o peso. Construiu-se a seguinte distribuio de frequncias:

    Peso (kg) Frequncia 2,0 | 2,5 8 2,5 | 3,0 18 3,0 | 3,5 15 3,5 | 4,0 7 4,0 | 4,5 2

    Total 50 O peso mdio dos recm-nascidos dado por

    Peso (kg) Frequncia Pmi Pmi Fi 2,0 | 2,5 8 2,25 18,00 2,5 | 3,0 18 2,75 49,50 3,0 | 3,5 15 3,25 48,75 3,5 | 4,0 7 3,75 26,25 4,0 | 4,5 2 4,25 8,50

    Total 50 151

    X = =

    k

    iiiFPmn 1

    1 = 50151 = 3,02

    X = 3,02 kg o peso mdio dos recm-nascidos.

  • [38]

    OBSERVAES: 1) Para o clculo de X com os dados da tabela acima, foi suposto que, todos os recm-nascidos

    com peso em um determinado intervalo tinham o peso dado pelo ponto mdio do intervalo, o que, em geral, no corresponde realidade (ver Berch, pg. 72, 74).

    2) A mdia aritmtica no pode ser calculada quando o 1 ou o ltimo intervalo tiverem extremos

    indefinidos, tipo mais que 4.5 Kg. 3) Quando os dados forem apresentados em uma tabela, mas NO estiverem agrupados em

    intervalos de classe, as medidas descritivas assumiro o valor Pmi como sendo a prpria varivel, por exemplo, para os valores tabelados como abaixo,

    Varivel Frequncia

    v1 F1 v2 F2 : : vk Fk

    Total n

    a mdia aritmtica dada por X = =

    k

    iiiFvn 1

    1 = [ ]kk FvFvFvn +++ ...1

    2211 .

    B. Mediana Neste caso, o procedimento para se determinar a mediana o seguinte: 1) Determinar o intervalo mediano, ou seja, o intervalo que contm a mediana.

    Esse intervalo tal que sua frequncia acumulada : i) igual a n/2 ou ii) maior que n/2 cuja frequncia acumulada do intervalo anterior menor que n/2 .

    2) Uma vez determinado o intervalo mediano, calcular a mediana usando a seguinte frmula:

    Med = lMed + Med

    2F

    Fn ac. h ,

    para o qual: lMed o limite inferior do intervalo mediano

    Fac a frequncia acumulada do intervalo anterior ao intervalo mediano

    FMed a frequncia absoluta do intervalo mediano

    h a amplitude do intervalo mediano

    Observao: Para o caso de dados tabelados, no se leva em considerao se par ou mpar.

  • [39]

    Exemplo: Consideremos os dados do exemplo anterior.

    Peso (kg) Frequncia 2,0 | 2,5 8 2,5 | 3,0 18 3,0 | 3,5 15 3,5 | 4,0 7 4,0 | 4,5 2

    Total 50 Determinar o peso mediano dos recm-nascidos. Sol: 1) Determinar a posio ocupada pela mediana, dada por,

    n/2 = 50 / 2 = 25 2) Determinar o intervalo que contm a mediana.

    Peso (kg) Frequncia Fac 2,0 | 2,5 8 8 lMed = 2,5 2,5 | 3,0 18 26 intervalo mediano Fac = 8 3,0 | 3,5 15 41 FMed = 18 3,5 | 4,0 7 48 h = 0,5 4,0 | 4,5 2 50

    Total 50 3) Determinar a mediana, por,

    Med = lMed + Med

    2F

    Fn ac. h = 2,5 +

    18825 . 0,5

    Logo, Med = 2,9 C. Moda Para os dados tabelados em intervalos, ser utilizado o Processo de Czuber (matemtico austraco 1851-1925), que leva em conta a influncia das classes adjacentes classe modal, mas tambm a prpria frequncia da classe modal. Para clculo da moda de Czuber preciso:

    1) Identificar o intervalo modal (intervalo que contm a moda), ou seja, o intervalo de maior frequncia absoluta simples.

    2) Determinar: i) lMo = limite inferior do intervalo modal

    ii) 1 = diferena entre a frequncia do intervalo modal e a frequncia do intervalo imediatamente anterior

  • [40]

    iii) 2 = diferena entre a frequncia do intervalo modal e a frequncia do intervalo imediatamente posterior

    iv) h = amplitude do intervalo

    3) Aplica-se a seguinte frmula Mo = lMo + 21

    1+

    . h Pode-se tambm, determinar a moda utilizando-se o Processo Grfico. 1) Construir o histograma da distribuio de frequncia. 2) Identificar o intervalo modal 3) Fazer a construo abaixo.

    Deduo da Frmula

    Veja que 1 = y1 y3 2 = y1 y2 h = x2 x1 => x2 = x1 + h

    A equao geral de uma reta dada por y = ax + b. Assim,

  • [41]

    da reta r1 tem-se que y1 = a1 x1 + b1 y2 = a1 x2 + b1 y* = a1 x* + b1

    => a1 = 12

    12xxyy

    =

    1*

    1*

    xxyy

    (I)

    da reta r2 tem-se que y1 = a2 x2 + b2 y3 = a2 x1 + b2 y* = a2 x* + b2

    => a2 = 21

    13xxyy

    =

    2*

    1*

    xxyy

    (II)

    De (I) e (II) acima, tem-se que

    y* y1 = 12

    1*

    12 ))((xx

    xxyy

    = 21

    2*

    13 ))((xx

    xxyy

    12

    1*

    2 ))((xx

    xx

    = )(

    ))((

    12

    2*

    1xx

    xx

    2 (x* x1) = 1 (x* x2) x* = 21

    2112++ xx x* =

    21

    1112 )(+

    ++ hxx

    x* = x1 + 21

    1+

    h Exemplo: Determinar a moda para a distribuio

    varivel Frequncia 0 | 1 3 lMo = 2 1 | 2 10 1 = 17 10 = 7 2 | 3 17 intervalo modal 2 = 17 8 = 9 3 | 4 8 h = 1 4 | 5 5

    Total 43 Sol: Clculo da moda pelo Processo de Czuber

    Mo = lMo + 21

    1+

    . h = 2 + 97

    7+ . 1 = 2 + 0,4375. Portanto, Mo = 2,44

    Processo Grfico:

  • [42]

    D. Separatrizes As separatrizes so medidas de posio e tm por finalidade dividir um conjunto numrico em partes iguais. D1 - QUARTIS (Qi) O procedimento para calcular os quartis o seguinte:

    1) Determinar PQi = 4ni a posio do quartil Qi , para i = 1, 2, 3.

    2) Com base na posio do quartil Qi , identificar o intervalo que contm Qi . Este intervalo tal

    que sua frequncia acumulada :

    i) igual a PQi ou ii) maior que PQi tal que a frequncia acumulada do intervalo anterior menor que PQi.

    3) Uma vez determinado o intervalo, calcular os quartis usando a frmula:

    Qi = lQi + iQ

    ac

    F

    Fni 4 . h para i = 1, 2, 3.

    para o qual: lQi o limite inferior do intervalo que contm Qi

    Fac a frequncia acumulada do intervalo anterior ao intervalo que contm Qi

    FMed a frequncia absoluta do intervalo que contm Qi

    h a amplitude do intervalo mediano

    Exemplo: Dada a distribuio seguinte, determinar os quartis.

    varivel Frequncia 7 | 17 6 17 | 27 15 27 | 37 20 37 | 47 10 47 | 57 5

    Total 56 Soluo: Inicialmente, determinar a frequncia acumulada para as classes

    varivel Frequncia Fac 7 | 17 6 6 17 | 27 15 21 27 | 37 20 41 37 | 47 10 51 47 | 57 5 56

    Total 56

  • [43]

    1) determinar as posies dos quartis: PQi = 4ni , i = 1, 2, 3;

    PQ1= 4)56(1 = 14 , PQ2 = 4

    )56(2 = 28 e PQ3 = 4)56(3 = 42

    2) determinar os intervalos que contm os quartis;

    varivel Frequncia Fac 7 | 17 6 6 17 | 27 15 21 intervalo que contem Q1 27 | 37 20 41 intervalo que contem Q2 37 | 47 10 51 intervalo que contem Q3 47 | 57 5 56

    Total 56

    3) calcular os quartis usando Qi = lQi + iQ

    ac

    F

    Fni 4 . h , para i = 1, 2, 3.

    Q1 = 17 + 15

    64

    )56(1 10 = 17 + 5,333 = 22,333

    Q2 = 27 + 20

    214

    )56(2 10 = 27 + 3,500 = 30,500

    Q3 = 37 + 10

    414

    )56(3 10 = 37 + 1,000 = 38,000

    Processo Grfico para determinao dos Quartis Pelo grfico de frequncias acumuladas (Ogiva de Galton) mostrado abaixo pode-se determinar rapidamente os quartis da seguinte forma: - Marcam-se no eixo das frequncias acumuladas os valores n/4 , n/2 e 3n/4 . - Por esses pontos so construdas retas paralelas ao eixo das abscissas, determinando na Ogiva trs pontos correspondentes. -Traa-se por estes pontos, retas perpendiculares ao eixo horizontal determinando Q1, Q2 e Q3.

  • [44]

    Box Plot ou boxplot Este grfico conhecido tambm como caixa de bigodes (box-and-whisker diagram) uma maneira pratica de representar graficamente conjunto de dados numricos atravs dos seus cinco nmeros resumos: a menor observao (mnimo do conjunto de dados), quartil inferior (Q1), mediana (Q2), o quartil superior (Q3), e a maior observao (mximo do conjunto de dados). Um desenho esquemtico tambm pode indicar quais as observaes, se existir algum, podem ser consideradas outliers, valores extremamente altos ou baixos. A existncia de outliers pode tanto indicar dados incorretos como dados vlidos que carecem de uma ateno especial. Dependendo do objetivo da anlise possvel que justamente os outliers sejam o ponto de interesse. Para construir um boxplot so necessrios: Primeiro Quartil, Mediana (ou Segundo Quartil), o Terceiro Quartil e o Intervalo Interquartil (IIQ). O grfico composto de uma caixa e duas hastes (conhecidas como bigodes).

    Nota: Boxplots pode ser traada na horizontal ou na vertical.

    Procedimento para montar um Box Plot 1. Para um conjunto de dados de tamanho n, disponha os dados em ordem crescente; 2. Calcule a mediana, Q1 e Q3; 3. Identifique o valor (MIN) e o valor (MAX) da amostra. 4. Trace um eixo vertical e marque neste eixo com uma escala adequada e de fcil leitura; 5. Sobre o eixo vertical, desenhe um retngulo da seguinte forma:

    Posicione a extremidade inferior do retngulo em Q1;

  • [45]

    Posicione a extremidade superior do retngulo em Q3; No interior do retngulo trace a mediana.

    6. Desenhe uma linha a partir da extremidade inferior do retngulo at a menor observao encontrada na faixa distncia de 0 a 1,5 (Q3 Q1) da extremidade inferior do retngulo;

    7. Desenhe uma linha a partir da extremidade superior do retngulo at a maior observao encontrada na faixa distncia de 0 a 1,5 (Q3 Q1) da extremidade superior do retngulo;

    8. Desenhe asteriscos para marcar as observaes localizadas a uma distncia de 1,5 (Q3 Q1) a 3 (Q3 Q1) de cada extremidade do retngulo, denotando possveis outliers;

    9. Desenhe crculos para marcar as observaes localizadas a uma distncia superior a 3 (Q3 Q1) de cada extremidade do retngulo, denotando provveis outliers;

    10. Coloque os limites das hastes da seguinte forma: Limite superior = Q3 + 1,5 (Q3 Q1) Limite inferior = Q3 1,5 (Q3 Q1)

    Interpretao

    A rea entre estes dois limites da caixa conhecido como o Intervalo Inter-Quartil e isso d uma indicao til da metade da disperso, no qual esto 50 por cento dos dados. Esta uma faixa mais robusta para a interpretao, porque a metade 50 por cento no afetada por outliers ou valores extremos, e d uma visualizao menos parcial da propagao de dados.

    H tambm uma linha na caixa que indica a mediana (ou o valor mais central) dos dados. No deve ser confundido dizendo que a mediana o valor que est no meio do conjunto de dados quando os valores so classificados por ordem, resultando no mesmo nmero de valores acima como abaixo. Esta uma medida de "tendncia central", ou em termos leigos, onde o centro de dados est. Saber disso importante para estimar o tipo de distribuio de dados que se tem.

    Os "bigodes" do box-plot so as linhas verticais da trama que se estendem desde a caixa at o mximo de 1,5 vezes o intervalo inter-quartil. O grfico deve conter os valores mnimo e mximo do conjunto de dados. Se houver "outliers" nos dados, eles estaro fora dos bigodes.

    As posies relativas da mediana e dos quartis e o formato dos bigodes do uma noo da simetria e do tamanho das caudas da distribuio. Quando a distribuio dos dados :

  • [46]

    simtrica, a linha que representa a mediana estar localizada mais ou menos no centro do retngulo e as duas linhas que partem das extremidades do retngulo tero aproximadamente os mesmos comprimentos;

    assimtrica direita, a linha que representa a mediana estar mais prxima de Q1 do que de Q3; assimtrica esquerda, a linha que representa a mediana estar mais prxima de Q3 do que de Q1.

    Exemplo: Considere o conjunto de 13 valores 4; 4; 4; 6; 6; 7; 8; 8; 8; 9; 9; 13; 16.

    [R] (x=c(4, 4, 4, 6, 6, 7, 8, 8, 8, 9, 9, 13, 16)) boxplot(x)

    Comparando vrios grupos com BoxPlot

    O Boxplot mostra as diferenas entre as populaes, sem fazer qualquer suposio sobre a distribuio estatstica subjacente: so no-paramtrico. Os espaamentos entre as diferentes partes de a ajuda da caixa indicar o grau de disperso (disseminao) e assimetria nos dados, e identificar outliers.

    possvel ver claramente que os dados do conjunto 2 possuem a mediana maior, o que implica em dizer que os dados do conjunto 2 tendem a ser maiores que os do conjunto 1 e tambm possui maior disperso j que tanto o IIQ quanto o tamanho dos bigodes so maiores. D2 - DECIS (Di)

  • [47]

    Considere dados tabelados em intervalos. Os decis so calculados seguindo o mesmo procedimento dos quartis, usando-se a frmula;

    Di = lDi + iD

    ac

    F

    Fni 10 . h , para i = 1, 2, . . . , 9.

    D3 - CENTIS (Ci) ou PERCENTIS (Pi) Procedendo de forma anloga aos clculos dos quartis e decis, tem-se:

    Pi = lPi + iP

    ac

    F

    Fni 100 . h , para i = 1, 2, . . . , 99.

    D4 - QUANTIS a forma geral para denotar uma separatriz que pode ser dividida em k partes iguais. O clculo para determinar os quantis anlogo aos quartis, decis e percentis. Exemplo: Os salrios (em salrio mnimo) de 160 professores de uma escola esto distribudos conforme a tabela a seguir. Calcule o Q1, D4 e o C85 e interprete os resultados.

    Salrio N de professores 1 | 3 20 3 | 5 40 5 | 7 60 7 | 9 30 9 | 11 10

    Total 160 1 (Passo) Determinar as frequncias acumuladas (Fac) da distribuio.

    Salrio N de professores Fac 1 | 3 20 20 3 | 5 40 60 5 | 7 60 120 7 | 9 30 150 9 | 11 10 160

    Total 160 2 (Passo) Calcular a posio do Quartil, Decil ou Percentil desejado, por uma das frmulas.

    PQi = 4ni => PQ1 = 1(160)/4 = 40

  • [48]

    PDi = 10ni => PD4 = 4(160)/10 = 64

    PCi = 100ni => PC85 = 85(160)/100 = 136

    3 (Passo) Identificar a que classe que contm o Quartil, Decil ou Percentil desejado por meio da

    frequncia acumulada simples (Fac): 1 Quartil (segunda classe) 4 Decil (terceira Classe) 85 Percentil (Quarta classe).

    4 (Passo) Calcular o Quartil, Decil ou Percentil desejado por meio de uma das frmulas:

    1 Quartil: Q1 = 3 + 402040 . 2 = 4 Salrios mnimos

    Interpretao: 25% dos professores da escola ganham at 4 salrios mnimos ou 75% dos professores ganham mais de 4 salrios mnimos.

    4 Decil: D4 = 5 + 606064 . 2 = 5,13 Salrios mnimos

    Interpretao: 40% dos professores da escola ganham at 5,13 salrios mnimos ou 60% dos professores ganham mais de 5,13 salrios mnimos.

    85 Percentil: C85 = 7 + 30120136 . 2 = 8,07 Salrios mnimos

    Interpretao: 85% dos professores da escola ganham at 8,07 salrios mnimos ou 15% dos professores ganham mais de 8,07 salrios mnimos. EXERCCIO: Na tabela abaixo esto os resultados de um teste psicolgico aplicado a 200 adolescentes:

    varivel Frequncia 14,5 | 24,5 10 24,5 | 29,5 24 29,5 | 34,5 38 34,5 | 39,5 54 39,5 | 44,5 22 44,5 | 49,5 18 49,5 | 54,5 22 54,5 | 59,5 12

    Total 200 a) Quantos pontos, no mnimo, o adolescente deve obter para que fique entre os 100 melhores? b) Quantos pontos, no mnimo, o adolescente deve obter para se classificar entre os 25% melhores?

  • [49]

    II - MEDIDAS DE VARIABILIDADE A. Varincia

    Consideremos a Distribuio de Frequncias a seguir, com mdia X = =

    k

    iiiFPmn 1

    1

    varivel Frequncia a1 | a2 F1 a2 | a3 F2

    : : ak | ak+1 Fk

    Total n

    Define-se VARINCIA por S2 = ( )=

    k

    iii FXPmn 1

    21

    Analogamente, a formula acima pode ser reescrita como

    S2 = ( )

    == n

    FPmFPm

    n

    k

    iiik

    iii

    2

    1

    1

    21

    Exemplo: Calcular a varincia para a Distribuio de Frequncias abaixo:

    varivel Frequncia 39,5 | 44,5 3 44,5 | 49,5 8 49,5 | 54,5 16 54,5 | 59,5 12 59,5 | 64,5 7 64,5 | 69,5 3 69,5 | 74,5 1

    Total 50 Soluo:

    varivel Fi Pmi Pmi Fi Pmi2 Pmi2Fi 39,5 | 44,5 3 42 126 1764 5292 44,5 | 49,5 8 47 376 2209 17672 49,5 | 54,5 16 52 832 2704 43264 54,5 | 59,5 12 57 684 3249 38988 59,5 | 64,5 7 62 434 3844 26908 64,5 | 69,5 3 67 201 4489 13467 69,5 | 74,5 1 72 72 5184 5184

    Total 50 2725 150775

  • [50]

    De, S2 = ( )

    == n

    FPmFPm

    n

    k

    iiik

    iii

    2

    1

    1

    21 =

    50)2725(150775

    501 2 = 45,25

    Portanto, S2 = 45,25 B. Desvio Padro a raiz quadrada positiva da varincia, ou seja, S = 2S Exemplo: Do exemplo anterior, tem-se que o desvio-padro S = 6,72

  • [51]

    LISTA DE EXERCCIOS

    Exerccio 1 - O histograma abaixo foi construdo com base numa pesquisa do tempo de servio dos empregados de uma determinada empresa. Baseada na tabela de distribuio de frequncias, determine:

    a) O tempo de servio mdio b) A distribuio de frequncias. c) A porcentagem de empregados com

    tempo de servio maior ou igual a 18 e menor que 24 anos

    d) A porcentagem de empregados com tempo de servio menor que 12 anos

    e) A porcentagem de empregados com tempo de servio maior ou igual que 25 anos

    f) O histograma e polgonos de frequncia

    g) O tempo de servio mediano h) A moda i) A amplitude total da srie j) O desvio mdio k) A varincia l) O desvio-padro

    m) O coeficiente de variao n) Q1 e Q3 o) P10 p) D6 q) P90 r) Classifique quanto assimetria.

    Exerccio 2 - Uma empresa produz caixas de papelo para embalagens de componentes eletrnicos e afirma que o nmero de defeitos por caixa se distribui conforme a seguinte tabela abaixo. Baseada na tabela de distribuio de frequncias, determine:

    No de defeito No de caixas a) O nmero mdio de defeitos por caixa 0 32 b) A distribuio de frequncias 1 28 c) A porcentagem de caixas com dois defeitos 2 11 d) A porcentagem de caixas menos que trs defeitos 3 5 e) A porcentagem de caixas com mais que trs defeitos 4 3 f) O histograma 5 1 g) O nmero mediano de defeitos por caixa

    h) A moda. i) A amplitude total da srie. j) O desvio mdio simples. k) A varincia. l) O desvio-padro. m) O coeficiente de variao

    n) Q1. o) Q3. p) P10. q) D6. r) P90. s) Classifique quanto assimetria.

    Exerccio 3 - Uma amostra aleatria de 250 residncias de famlias, classe mdia com dois filhos, revelou a seguinte distribuio do consumo mensal de energia eltrica. Baseada na tabela de distribuio de frequncias, determine:

    Consumo No de a) O consumo mdio por residncia.

  • [52]

    mensal (Kwh) famlias 000 | 050 2 b) A distribuio de frequncias. 050 | 100 15 c) A porcentagem de famlias com consumo maior ou igual a 200 e 100 | 150 32 menor que250 kwh. 150 | 200 47 d) A porcentagem de famlias com consumo menor que 200 kwh. 200 | 250 50 e) A porcentagem de famlias com consumo maior ou igual que 250 kwh.250 | 300 80 f) O histograma e polgonos de frequncia. 300 | 350 24 g) O consumo mediano.

    h) A moda. i) A amplitude total da srie. j) O desvio mdio simples. k) A varincia. l) O desvio-padro. m) O coeficiente de variao

    n) Q1. o) Q3. p) P10. q) D6. r) P90. s) Classifique quanto assimetria.

    Exerccio 4 - A tabela a seguir demonstra os dados anuais de vendas (em R$) das regies A, B, C e D por vendedor.

    Regio Vendas Mdia Desvio-padro A 10.000 2.400 B 13.000 3.000 C 18.000 4.000 D 20.000 7.000

    Destacar qual a regio que apresentou equipe de vendas mais homognea. Exerccio 5 - Considere que um aluno estude Estatstica de forma suficiente se forem satisfeitas as duas seguintes condies:

    (i) tempo mdio semanal de estudo superior a 10 horas; (ii) variabilidade relativa do tempo semanal de estudo inferior a 20%.

    Os dados a seguir representam o tempo gasto semanalmente por certo aluno com o estudo de Estatstica durante 5 semanas consecutivas. Xi : tempo de estudo (em horas): 6 12 8 11 15 O aluno indicado estuda Estatstica de forma suficiente? Por qu? Exerccio 6 - Sabe-se que um artigo de produo est sob controle se seu peso estiver dentro da faixa

    nSX 97,0 e

    nSX 97,0+ , para X sendo mdia amostral, S o desvio-padro da amostra e

    n o tamanho da amostra. Sete artigos da produo foram selecionados para verificao do controle da produo quanto varivel peso. Desta amostra foram anotados os seguintes pesos (Kg): 8,4 6,4 9,8 8,2 7,4 9,1 5,3. Quais os limites de controle para os dados acima? Exerccio 7 - Foram realizadas 10 observaes relativas ao tempo de fabricao de um produto por duas equipes, trabalhando em idnticas condies. Os valores obtidos foram (em minutos):

  • [53]

    Equipe Tempos observados A B

    40 38 27 25 38 37 29 39 34 43 27 29 37 44 43 30 28 28 29 39

    a) Qual equipe tem o melhor tempo de fabricao. Conclua baseado nas medidas de posio. b) Compare a regularidade (em termos de disperso) nos tempos de fabricao do produto pelas

    duas equipes. c) Foi estabelecida uma remunerao extra para a equipe em que a frequncia dos tempos

    observados superiores a 30 min seja, no mximo, 50%. Verifique se as duas equipes ganharam essa remunerao. Por qu?

    Exerccio 8 - O departamento pessoal de uma grande empresa fez um levantamento do salrio de 100 funcionrios obtendo os seguintes resultados:

    Salrio (SM) N funcion. % funcion.

    Frequenc. Acumul.

    Ponto Mdio (Xi)

    XiFi (Xi)2Fi

    0 | 25 1 | 30 | 500 | 15 90 | 10 9 TOTAL Completar a tabela acima Exerccio 9 - Voc o responsvel por uma etapa de um processo produtivo e decidiu analisar o tempo (em minutos) de execuo pela equipe do turno da manh de uma determinada tarefa. Os tempos esto apresentados a seguir:

    12 26 9 15 19 28 24 20 35 14 25 29 32 36 38 27 19 29 15 34 30 29 23 38 26 29 14 17 10 21 31 11 19 20 25 23

    Para que possa tomar certas decises, voc pede:

    a) Organize esses valores em uma distribuio de frequncia adequada; b) Qual a proporo de funcionrios com tempo de no mnimo 24 minutos? c) Se apenas 30% dos funcionrios tiverem tempo igual ou superior a 29 minutos eles no

    precisaro fazer hora extra. Os funcionrios da manh precisaro fazer hora extra? d) Qual o maior tempo dos 25% funcionrios mais rpidos? e) Construa o histograma da distribuio.

    Exerccio 10 - Dada a distribuio relativa a 100 lanamentos de 5 moedas simultaneamente, resultando em:

    N de caras 0 1 2 3 4 5 Frequncias 4 14 34 29 16 3

  • [54]

    Para um novo conjunto de 5 moedas, a distribuio relativa a 100 lanamentos resultaram em:

    N de caras 0 1 2 3 4 5 Frequncias 2 11 42 22 15 6

    Qual conjunto de moedas se apresenta mais homogneo? Exerccio 11 - Considere as notas de trs alunos em Matemtica nos quatro bimestres de um mesmo ano. O professor de Matemtica escolher um deles para representar a turma numa competio de Matemtica, o que tiver a melhor regularidade. Qual deles ser escolhido?

    1 Bim 2 Bim 3 Bim 4 Bim Aluno A Aluno B Aluno C

    9,5 8,5 10,0

    8,5 10,0 7,5

    9,0 10,0 9,5

    9,5 8,0 9,5