Estatística descritiva básica: Medidas de tendência .Estatística descritiva básica: ... nos

  • View
    215

  • Download
    0

Embed Size (px)

Text of Estatística descritiva básica: Medidas de tendência .Estatística descritiva básica: ... nos

  • Estatstica descritiva bsica: Medidas de tendncia central

    ACH2021 Tratamento e

    Anlise de Dados e Informaes

    Marcelo de Souza Lauretto

    marcelolauretto@usp.br

    www.each.usp.br/lauretto

    *Parte do contedo desta apresentao baseada nos slides da Profa. Patrcia Rufino Oliveira

  • Introduo

    Tabelas e grficos so formas convenientes de sumarizar a forma geral de uma distribuio de valores de uma forma facilmente compreensvel.

    Contudo, frequentemente se necessita sumarizar a distribuio de forma mais condensada.

    Duas estatstica adicionais extremamente teis: 1. Medidas de tendncia central: fornecem uma ideia do caso mdio

    tpico na distribuio. Ex: "O salrio inicial mdio para programadores em So Paulo de R$

    3.800,00 mensais."

    2. Medidas de disperso: fornecem uma ideia da variabilidade ou heterogeneidade na distribuio. Ex: "O salrio inicial para programadores em So Paulo varia de R$

    3.000,00 a R$ 4.500,00."

    (prximas aulas)

  • Moda

    A moda de uma distribuio de escores o valor que ocorre mais frequentemente. Ex: no conjunto de escores 58, 82, 82, 90, 98, a moda 82 porque

    ocorre duas vezes, enquanto os demais escores ocorrem apenas uma vez.

    til para sumarizar variveis qualitativas. Ex: preferncias de religies (dados fictcios)

    Moda da distribuio: Protestante

  • Limitaes da moda: Algumas distribuies no possuem moda;

    Ex:

  • Limitaes da moda: Algumas distribuies possuem tantas modas que a estatstica deixa

    de ter significado.

    Ex: distribuio de escores de testes.

    Modas: 55,66,78,82,90,97. Qual dessas representa um valor "tpico"?

  • Limitaes da moda: Em variveis quantitativas ou qualitativas ordinais, a moda pode no

    ser central na distribuio como um todo.

    Ex: distribuio de escores de testes.

    Moda: 93; esse valor um bom representante da distribuio?

  • Mediana

    A mediana o valor situado exatamente no centro de uma distribuio de escores.

    Mais precisamente, a mediana o escore do caso que est exatamente no meio da distribuio: Metade dos casos tm escores maiores do que a mediana e metade

    dos casos tm escores mais baixos do que a mediana.

    Exemplo: Se a mediana da renda familiar anual de uma comunidade $ 45.000, ento metade das famlias ganha mais do que R$ 45.000 e metade ganha menos.

  • Clculo da mediana: Ordene os escores em ordem crescente (ou decrescente)

    Se o nmero de elementos (n) for mpar:

    A mediana ser o elemento localizado exatamente no centro.

    O ndice do elemento central dado por (n+1) / 2.

    Se o nmero de elementos (n) for par:

    A mediana ser exatamente o valor central dos dois casos do meio da distribuio.

    Os ndices do primeiro e do segundo casos centrais so dados por n/2 e n/2 + 1.

    Por exemplo, se n=14, a mediana o escore situado no centro dos escores do stimo e oitavo casos.

  • Clculo da mediana - exemplos:

    Clculo da mediana com sete casos (n mpar)

    Clculo da mediana com oito casos (n par)

  • Clculo da mediana para dados organizados em tabelas de frequncias: a) Calcula-se inicialmente a posio do elemento original dos dados

    correspondente mediana;

    b) Determinada a posio da mediana, localiza-se na tabela de frequncias a linha que contm essa posio.

    Ex: em um grupo de 36 turmas, as frequncias de turmas por nmero de alunos reprovados foi a observada abaixo. Qual a mediana das reprovaes?

    Nmero de alunos reprovados por turma

    Frequncia Frequncia acumulada

    0 1 1

    1 5 6

    2 8 14

    3 13 27

    4 7 34

    5 0 34

    6 2 36

    Como n=36 par, a mediana a mdia dos elementos de ordem (36/2)=18 e (36/2)+1=19.

    Analisando as frequncias acu- muladas na tabela ao lado, conclui-se que a mediana tem valor 3.

    Contm o 18 e o 19 elementos

  • Clculo da mediana para dados agrupados em classes: Determina-se a linha da tabela que contm a mediana na tabela de

    forma similar quela mostrada no slide anterior (clculo da mediana para dados organizados em tabelas de frequncias);

    Uma vez determinada a classe, deve-se calcular o valor da mediana por mtodo de interpolao.

    Ex: distribuio das notas obtidas por candidatos em um vestibular.

  • Aps calcular a posio da mediana, localiza-se, a partir das frequncias acumuladas na tabela, a classe na qual a mesma se encontra.

  • O valor da mediana obtido aplicando-se a frmula:

    = +

    2 1

    onde:

    = linha da tabela que contm a mediana;

    = limite inferior da classe que contm a mediana;

    a = amplitude do intervalo de classe;

    = frequncia da classe que contm a mediana;

    = quantidade total de elementos;

    1 = Frequncia acumulada at a classe anterior classe que contm a mediana.

  • Outras medidas de posio: percentis, decis, quartis

    A mediana pertence a uma classe de estatsticas que medem posio ou locao.

    Frequentemente, til localizar outros pontos tambm: Podemos querer, por exemplo, encontrar os escores que dividem a

    distribuio em quatro partes, ou o ponto abaixo do qual um certo percentual dos casos se encontram.

    Uma aplicao tpica dessas medidas so os escores em testes padronizados.

    "Um escore de 476 maior do que 46% dos escores."

  • Percentis

    Uma estatstica comumente utilizada para reportar posies o percentil, que identifica o ponto abaixo do qual uma porcentagem especfica dos casos se encontram. Ex: Se um escore de 476 reportado como o 46 percentil, isso

    significa que 46% dos casos tm escores abaixo desse valor.

    Percentis comuns: 5%, 10%, 25%, 50% (mediana), 75%, 90%, 95%.

  • Clculo do k-simo percentil: 1. Ordene os escores em ordem.

    2. Em seguida, multiplique k por cento pelo nmero total de casos mais um (n+1):

    3. Se o valor resultante for um nmero inteiro:

    Ento o k-simo percentil ser o R-simo elemento do rol de escores.

    Se o valor resultante no for um nmero inteiro o k-simo percentil obtido por interpolao:

    Denote por IR a poro inteira de R, e por FR a poro fracionria de R. Por exemplo, se R=2.25, ento IR=2 e FR=0.25.

    Denote por XIR e XIR+1 os escores das posies IR e IR+1, respectivamente.

    O k-simo percentil ser computado como:

    OBS: O 100 percentil corresponder ao maior escore.

    )1(100

    nk

    R

    ) (percentil simo 1 IRIRIR XXFRXk

  • Exemplo 1: Calcular o 37 percentil de uma amostra de 78 elementos: Ordenamos a amostra em ordem crescente;

    Calculamos R:

    IR = 29, FR=0.23

    O 37 percentil corresponder a 23/100 da distncia entre o 29 e o 30 casos:

    23.29)178(100

    37)1(

    100 n

    kR

    ) (23.0 29302937 XXXP

  • Exemplo 2: Calcular o 25 percentil da amostra representada na tabela ao lado (j em ordem crescente): Calculamos R:

    IR = 2, FR=0.25

    O 25 percentil corresponder a 25/100 da distncia entre o 2 e o 3 casos:

    OBS: Pela definio acima, o clculo da mediana um caso particular. Por exemplo, a mediana da tabela ao lado dada por:

    25.2)18(100

    25)1(

    100 n

    kR

    P25 = X2 + 0.25(X3 - X2 )

    = 5+ 0.25(7- 5) = 5.5

    R=50

    100(8+1) = 4.5

    P50 = X4 + 0.5(X5 - X4 )

    = 8+ 0.5(9 -8) = 8.5

  • Percentis especiais: decis, quartis, quintis

    Pela definio, percentis dividem a distribuio de escores em centsimos. Alguns tipos especiais de percentis so descritos abaixo.

    Os quartis so bastante populares, e dividem a distribuio de escores em 4 partes (ver figura abaixo). O 1, 2 e 3 quartis correspondem ao 25, 50 e 75 percentis,

    respectivamente. So denotados usualmente por Q1, Q2 e Q3.

    Os Decis dividem a distribuio de escores em dcimos. Assim, o 1 decil o ponto abaixo do qual 10% dos casos se situam, e

    equivalente ao 1 percentil, ou seja, P10.

    Raciocnio anlogo serve para o 2, 3, ..., 10 decil.

  • Os Quintis dividem a populao em cinco partes: O 1, 2, 3 e 4 quintis correspondem ao 20, 40, 60 e 80 percentis,

    respectivamente.

    OBS: Os percentis (incluindo seus casos particulares: mediana, quartis, etc) podem ser aplicados sobre variveis quantitativas ou qualitativas ordinais.

  • Alguns exemplos de aplicao de percentis, quintis e decis so encontrados nos relatrios Estatsticas de renda no repositrio do IPEA:

    www.ipeadata.gov.br social Temas Renda:

    Exemplos:

    Renda - razo entre a renda dos 20% mais ricos e a renda dos 20% mais pobres

    Renda domiciliar - participao dos 40% mais pobres

    Renda domiciliar - participao por dcimo da populao - 1

    Renda domiciliar - participao por quintil - 1

    Discuta como os indicadores exemplificados acima so calculados.

    http://www.ipeadata.gov.br/

  • Mdia

    A mdia a medida de tendncia central mais comumente utilizada para descrever resumidamente uma distribuio de frequncia.

    Esta estatstica representa o escore mdio de uma distribuio observada.

    usualmente denotada por .

  • Mdia aritmtica simples

    dada pela diviso entre a soma dos escores observados (x1, x2, ... , xn) e o nmero total de observaes (n):

    =

    =1

    Este tipo de mdia calculado quando os valores no esto tabulados, ou seja, quando os escores so conhecidos individualmente.

    Ex: Suponha uma mostra de 10 crianas de 5 anos de idade, com dados referentes a seus pesos (em Kg): 23.0, 20.0, 22.0, 19.0, 25.0, 28.2, 24.0, 21.0, 27.0, 21.0.