Upload
phamdung
View
219
Download
0
Embed Size (px)
Citation preview
Estatística Descritiva
Prof. Paulo Cesar F. de Oliveira, BSc, PhD
15/08/13 1 © P C F de Oliveira 2013
Capítulo 02 Esta.s/ca Descri/va
15/08/13 2 © P C F de Oliveira 2013
Seção 2.3 Medidas de Tendência Central
Capítulo 02 Esta.s/ca Descri/va Ø Medidas de Tendência Central Ø São valores de um conjunto de dados que representam uma entrada 4pica, ou central
Ø Mais usadas Ø Média Ø Mediana Ø Moda
15/08/13 3 © P C F de Oliveira 2013
Capítulo 02 Esta.s/ca Descri/va Ø Medidas de Tendência Central
Ø Média Ø Soma de todas as entradas de dados dividida pelo número de entradas
Ø Notação sigma: Σx = somar todas as entradas de dados (x) no conjunto de dados.
Ø Média da População
Ø Média da Amostra
15/08/13 4 © P C F de Oliveira 2013
�
µ =x∑
N
�
x =x∑
n
Capítulo 02 Esta.s/ca Descri/va Ø Exemplo – Média
Ø Os preços (em dólares) para uma amostra de vôos entre Chicago e Cancun são listados abaixo. Qual é a média de preço dos vôos?
872 432 397 427 388 782 397
15/08/13 5 © P C F de Oliveira 2013
Capítulo 02 Esta.s/ca Descri/va Ø Solução
Ø A soma dos preços dos vôos é Σx = 872 + 432 + 397 + 427 + 388 + 782 + 397 = 3695 Ø Para encontrar o preço médio divida a soma dos preços
pelo número de preços na amostra
15/08/13 6 © P C F de Oliveira 2013
872 432 397 427 388 782 397
�
x =x∑
n= 3695
7= 527,9
Capítulo 02 Esta.s/ca Descri/va Ø Medidas de Tendência Central Ø Mediana
Ø O valor que está no meio dos dados quando o conjunto dos dados é ordenado
Ø Mede o centro de um conjunto de dados ordenado dividindo-‐o em duas partes iguais
Ø Se o conjunto de dados possui um número de entradas: Ø ímpar: a mediana é o elemento do meio Ø par: a mediana será a média dos dois elementos centrais
15/08/13 7 © P C F de Oliveira 2013
Capítulo 02 Esta.s/ca Descri/va Ø Exemplo – Mediana
Ø Os preços (em dólares) para uma amostra de vôos entre Chicago e Cancun são listados abaixo. Qual é a mediana dos preços dos vôos?
15/08/13 8 © P C F de Oliveira 2013
872 432 397 427 388 782 397
Capítulo 02 Esta.s/ca Descri/va Ø Solução
Ø Ordene os dados primeiro 388 397 397 427 432 782 872
Ø Existem 7 entradas (número impar), portanto, a mediana é o valor do meio, ou a quarta entrada de dados
15/08/13 9 © P C F de Oliveira 2013
872 432 397 427 388 782 397
Capítulo 02 Esta.s/ca Descri/va Ø Exemplo – Mediana
Ø O preço de $432 não está mais disponível. Qual é a mediana dos preços dos vôos restantes?
15/08/13 10 © P C F de Oliveira 2013
872 397 427 388 782 397
Capítulo 02 Esta.s/ca Descri/va Ø Solução
Ø Ordene os dados primeiro 388 397 397 427 782 872
Ø Existem 6 entradas (número par), portanto, a mediana é média das duas entradas do meio.
15/08/13 11 © P C F de Oliveira 2013
872 397 427 388 782 397
�
med = 397 + 4272
= 8242
= 412
Capítulo 02 Esta.s/ca Descri/va Ø Medidas de Tendência Central
Ø Moda Ø Entrada de dados que ocorre com mais frequência Ø Se nenhuma entrada é repe\da, o conjunto de dados não possui moda
Ø Se duas entradas ocorrem com a mesma frequência elevada, cada é uma moda e são chamados de bimodais.
15/08/13 12 © P C F de Oliveira 2013
Capítulo 02 Esta.s/ca Descri/va Ø Exemplo – Moda
Ø Os preços (em dólares) para uma amostra de vôos entre Chicago e Cancun são listados abaixo. Qual é a moda dos preços dos vôos?
15/08/13 13 © P C F de Oliveira 2013
872 432 397 427 388 782 397
Capítulo 02 Esta.s/ca Descri/va Ø Solução
Ø Ordene os dados primeiro 388 397 397 427 432 782 872
Ø A entrada 397 ocorre duas vezes, enquanto que as outras ocorrem apenas uma vez.
Ø Portanto a moda dos preços dos vôos é de $397
15/08/13 14 © P C F de Oliveira 2013
872 432 397 427 388 782 397
Capítulo 02 Esta.s/ca Descri/va Ø Exemplo – Moda
Ø Em um debate polí\co, pediu-‐se que uma amostra dos membros do público citasse o par\do ao qual eles pertenciam. As respostas estão resumidas na tabela a seguir. Qual é a moda das respostas?
15/08/13 15 © P C F de Oliveira 2013
Par\do Polí\co Frequência, f Democrata 34 Republicano 56 Outro 21 Não responderam 9
Capítulo 02 Esta.s/ca Descri/va Ø Solução
15/08/13 16 © P C F de Oliveira 2013
Par\do Polí\co Frequência, f Democrata 34 Republicano 56 Outro 21 Não responderam 9
A resposta que ocorre com mais frequência é “Republicano”. Desta forma a moda é “Republicano”. Isto significa que, nessa amostra, há mais republicanos do que pessoas de qualquer outra agremiação polí\ca.
Capítulo 02 Esta.s/ca Descri/va Ø Medidas de Tendência Central
Ø Comparando a Média, Mediana e a Moda Ø Todas as 3 medidas descrevem uma entrada 4pica de um conjunto de dados
Ø Vantagem de usar a média Ø É a medida mais confiável porque leva em conta todas as entradas do conjunto
Ø Desvantagem de usar a média Ø Muito afetada por dados discrepantes (outliers) Ø Um dado discrepante é aquele que está muito afastado dos outros dados do conjunto.
15/08/13 17 © P C F de Oliveira 2013
Capítulo 02 Esta.s/ca Descri/va Ø Exemplo – Comparando as 3 medidas
Ø Encontre a média, a mediana e a moda da seguinte amostra de idades de uma classe. Qual é a medida de tendência central que melhor descreve uma entrada de dados? Existe algum dado estranho?
15/08/13 18 © P C F de Oliveira 2013
Idades em uma classe
20 20 20 20 20 20 21
21 21 21 22 22 22 23
23 23 23 24 24 65 Dado discrepante
Capítulo 02 Esta.s/ca Descri/va Ø Solução
Ø Média
Ø Mediana
Ø Moda
15/08/13 19 © P C F de Oliveira 2013
Idades em uma classe
20 20 20 20 20 20 21
21 21 21 22 22 22 23
23 23 23 24 24 65
�
x =x∑
n= 47520
= 23,75anos
�
Med = 21+ 222
= 21,5anos
�
Moda = 20anos
Capítulo 02 Esta.s/ca Descri/va Ø Solução – Comparando resultados
Ø A média leva em conta todas as entradas, mas é influenciada pelo dado estranho de 65
Ø A mediana também leva em conta todas as entradas, mas não é afetada pelo dado estranho
Ø Neste caso a moda existe, mas não parece representar uma entrada 4pica
15/08/13 20 © P C F de Oliveira 2013
Média ≈ 23,8 anos Mediana = 21,5 anos Moda = 20 anos
Capítulo 02 Esta.s/ca Descri/va Ø Solução – Comparando resultados
Ø Às vezes uma comparação gráfica pode ajudar na sua decisão sobre qual medida de tendência central melhor representa um conjunto de dados
15/08/13 21 © P C F de Oliveira 2013
Nesse caso, parece que a mediana é a que melhor descreve o conjunto de dados.
Capítulo 02 Esta.s/ca Descri/va Ø Medidas de Tendência Central
Ø Média Ponderada Ø Média de um conjunto de dados cujas entradas têm pesos variáveis.
15/08/13 22 © P C F de Oliveira 2013
�
x =x ⋅ w( )∑
w∑Onde: w é o peso de cada entrada de x
Capítulo 02 Esta.s/ca Descri/va Ø Exemplo
Ø Você está assis\ndo a um curso no qual sua nota é determinada a par\r de cinco fontes: 50% da média de seus testes, 15% de seu exame no meio do curso, 20% de seu exame final, 10% de seu trabalho no laboratório de informá\ca e 5% do seu trabalho feito em casa. As suas notas são 86 (média dos testes), 96 (exame no meio do curso), 82 (exame final), 98 (laboratório de informá\ca) e 100 (trabalho de casa). Qual é a média ponderada de suas notas?
15/08/13 23 © P C F de Oliveira 2013
Capítulo 02 Esta.s/ca Descri/va Ø Solução
15/08/13 24 © P C F de Oliveira 2013
Fonte Notas, x Pesos, w x·w Média dos Testes 86 0,50 86x0,50= 43,0 Exame do Meio 96 0,15 96x0,15 = 14,4 Exame Final 82 0,20 82x0,20 = 16,4 Laboratório de Informá\ca 98 0,10 98x0,10 = 9,8 Trabalho de casa 100 0,05 100x0,05 = 5,0
Σw = 1 Σ(x·w) = 88,6
�
x =x ⋅ w( )∑
w∑= 88,6
1= 88,6
Capítulo 02 Esta.s/ca Descri/va Ø Medidas de Tendência Central
Ø Média de Dados Agrupados Ø Média de uma Distribuição de Freqüência
15/08/13 25 © P C F de Oliveira 2013
�
x =x ⋅ f( )∑n
Onde: x e f são respec\vamente os pontos médios e as frequências de uma classe �
n = f∑Observe que:
Capítulo 02 Esta.s/ca Descri/va Ø Média de uma Distribuição de Freqüência
15/08/13 26 © P C F de Oliveira 2013
Em Palavras Em Símbolos 1. Calcule o ponto médio de cada classe.
2. Calcule a soma dos produtos entre os pontos médios e as freqüências.
3. Calcule a soma das freqüências.
4. Calcule a média da distribuição de freqüência.
�
x =x ⋅ f( )∑n
�
n = f∑�
x =lim inf( ) + lim sup( )
2
�
x ⋅ f( )∑
Capítulo 02 Esta.s/ca Descri/va Ø Exemplo
Ø Use a distribuição de freqüência ao lado para aproximar a média do número de minutos que uma amostra de internautas gastou durante sua navegação mais recente na rede.
15/08/13 27 © P C F de Oliveira 2013
Classe Ponto Médio
Frequência, f
7 – 18 12,5 6 19 – 30 24,5 10 31 – 42 36,5 13 43 – 54 48,5 8 55 – 66 60,5 5 67 – 78 72,5 6 79 – 90 84,5 2
Capítulo 02 Esta.s/ca Descri/va Ø Solução
15/08/13 28 © P C F de Oliveira 2013
Classe Ponto Médio, x
Freqüência, f (x·f)
7 – 18 12,5 6 12,5x6 = 75,0 19 – 30 24,5 10 24,5x10 = 245,0 31 – 42 36,5 13 36,5x13 = 474,5 43 – 54 48,5 8 48,5x8 = 388,0 55 – 66 60,5 5 60,5x5 = 302,5 67 – 78 72,5 6 72,5x6 = 435,0 79 – 90 84,5 2 84,5x2 = 169,0
n = 50 Σ(x·f) = 2089,0
�
x =x ⋅ f( )∑n
�
x = 208950
≈ 41,8
Capítulo 02 Esta.s/ca Descri/va Ø Aspecto das Distribuições
Ø Um gráfico revela várias caracterís\cas de uma distribuição de freqüência. Uma delas é o aspecto. Ø Simétrica quando pode-‐se traçar uma linha ver\cal pelo ponto médio do gráfico de distribuição e as duas metades resultantes forem aproximadamente imagens espelhadas
Ø Uniforme (retangular) quando todas as entradas, ou classes, na distribuição \verem frequências iguais. Ela também é simétrica.
Ø Assimétrica se a “cauda” do gráfico se prolongar mais de um lado do que o outro. Ø Uma distribuição será assimétrica à esquerda se a sua cauda se
prolongar para a esquerda. Ø Uma distribuição será assimétrica à direita se sua cauda se prolongar
para a direita. 15/08/13 29 © P C F de Oliveira 2013
Capítulo 02 Esta.s/ca Descri/va Ø Aspecto das Distribuições
15/08/13 30 © P C F de Oliveira 2013
Uma linha ver\cal pode ser desenhada no meio do gráfico de distribuição e as metades resultantes se parecem com imagens espelhadas Média = Mediana = Moda
Capítulo 02 Esta.s/ca Descri/va
15/08/13 31 © P C F de Oliveira 2013
Média = Mediana
Todas as entradas na distribuição têm frequências iguais ou quase iguais
Capítulo 02 Esta.s/ca Descri/va Ø Aspecto das Distribuições
15/08/13 32 © P C F de Oliveira 2013
Ø Assimétrica nega\vamente
Ø A cauda do gráfico alonga-‐se mais à esquerda
Ø A média fica à esquerda da mediana
Média < Mediana
Capítulo 02 Esta.s/ca Descri/va Ø Aspecto das Distribuições
15/08/13 33 © P C F de Oliveira 2013
Ø A cauda do gráfico alonga-‐se mais à direita
Ø A média fica à direita da mediana
Média > Mediana
Capítulo 02 Esta.s/ca Descri/va Ø Medidas de Variação Ø Indicam o quanto os dados se apresentam dispersos (espalhados) em torno da região central
Ø Caracterizam, portanto, o grau de variação existente no conjunto de valores
Ø Mais usadas Ø Amplitude Total Ø Desvio-‐padrão Ø Variância
15/08/13 35 © P C F de Oliveira 2013
Capítulo 02 Esta.s/ca Descri/va Ø Medidas de Variação Ø Amplitude Total
Ø É a diferença entre as entradas máxima e a mínima do conjunto.
Ø Os dados devem ser quan\ta\vos Amplitude Total = (entrada máxima) – (entrada mínima)
15/08/13 36 © P C F de Oliveira 2013
Capítulo 02 Esta.s/ca Descri/va Ø Exemplo
Ø Uma empresa contratou 10 pessoas com curso superior. O salário inicial dessas pessoas é mostrado a seguir.
Salário inicial (em milhares de dólares) 41 38 39 45 47 41 44 41 37 42
15/08/13 37 © P C F de Oliveira 2013
Capítulo 02 Esta.s/ca Descri/va Ø Solução
Ø Deve-‐se colocar os dados em ordem para determinar o menor e o maior salário
37 38 39 41 41 41 42 44 45 47
Amplitude Total = salário máx. – salário mín. = 47 – 37 = 10
15/08/13 38 © P C F de Oliveira 2013
mínimo máximo
Capítulo 02 Esta.s/ca Descri/va Ø Medidas de Variação
Ø Desvio Ø Diferença entre a entrada e a média do conjunto de dados.
Ø Conjunto de dados de uma população Desvio de x = x – µ
Ø Conjunto de dados de uma amostra Desvio de x = x – x
15/08/13 39 © P C F de Oliveira 2013
Capítulo 02 Esta.s/ca Descri/va Ø Exemplo
Ø Uma empresa contratou 10 pessoas com curso superior. O salário inicial dessas pessoas é mostrado a seguir.
Salário inicial (em milhares de dólares) 41 38 39 45 47 41 44 41 37 42
15/08/13 40 © P C F de Oliveira 2013
Capítulo 02 Esta.s/ca Descri/va Ø Solução
Ø Calcula-‐se primeiramente o salário médio inicial
Ø Depois calcula-‐se o desvio para cada entrada de dados
15/08/13 41 © P C F de Oliveira 2013
�
µ = 41510
= 41,5
Salário, x Desvio: x – µ 41 41 – 41,5 = –0,5 38 38 – 41,5 = –3,5 39 39 – 41,5 = –2,5 45 45 – 41,5 = 3,5 47 47 – 41,5 = 5,5 41 41 – 41,5 = –0,5 44 44 – 41,5 = 2,5 41 41 – 41,5 = –0,5 37 37 – 41,5 = –4,5 42 42 – 41,5 = 0,5
Σx = 415 Σ(x – µ) = 0
Capítulo 02 Esta.s/ca Descri/va Ø Medidas de Variação
Ø Variância Populacional
Ø Desvio Padrão Populacional
15/08/13 42 © P C F de Oliveira 2013
�
σ 2 =x − µ( )2∑N
�
σ = σ 2 =x − µ( )2∑N
Soma dos quadrados, SSx
Capítulo 02 Esta.s/ca Descri/va Ø Obtendo a Variância e o Desvio Padrão Populacional Populacional
15/08/13 43 © P C F de Oliveira 2013
Em Palavras Em Símbolos
1. Calcule a média do conjunto de dados.
2. Calcule o desvio de cada entrada.
3. Eleve cada desvio ao quadrado.
4. Some os resultados para obter a soma dos quadrados.
�
SSx = x − µ( )2∑�
x − µ( )2�
µ =x∑
N
�
x − µ
Capítulo 02 Esta.s/ca Descri/va Ø Obtendo a Variância e o Desvio Padrão Populacional Populacional
15/08/13 44 © P C F de Oliveira 2013
Em Palavras Em Símbolos
5. Divida por N para obter a variância populacional.
6. Calcule raiz quadrada para obter o desvio padrão populacional.
�
σ 2 =x − µ( )2∑N
�
σ =x − µ( )2∑N
Capítulo 02 Esta.s/ca Descri/va Ø Exemplo
Ø Uma empresa contratou 10 pessoas com curso superior. Os salários iniciais para cada um delas são mostrados abaixo. Calcule a variância e o desvio padrão populacional para esses salários.
Salário inicial (em milhares de dólares) 41 38 39 45 47 41 44 41 37 42
15/08/13 45 © P C F de Oliveira 2013
Capítulo 02 Esta.s/ca Descri/va Ø Solução
Ø Lembre-‐se que:
Ø Calcule SSx Ø N = 10
15/08/13 46 © P C F de Oliveira 2013
�
µ = 41510
= 41,5
Σ(x – µ) = 0
Salário, x Desvio: x – µ Quadrados: (x – µ)2 41 41 – 41,5 = –0,5 (–0,5)2 = 0,25 38 38 – 41,5 = –3,5 (–3,5)2 = 12,25 39 39 – 41,5 = –2,5 (–2,5)2 = 6,25 45 45 – 41,5 = 3,5 (3,5)2 = 12,25 47 47 – 41,5 = 5,5 (5,5)2 = 30,25 41 41 – 41,5 = –0,5 (–0,5)2 = 0,25 44 44 – 41,5 = 2,5 (2,5)2 = 6,25 41 41 – 41,5 = –0,5 (–0,5)2 = 0,25 37 37 – 41,5 = –4,5 (–4,5)2 = 20,25 42 42 – 41,5 = 0,5 (0,5)2 = 0,25
SSx= 88,5 �
σ 2 = 88,510
= 8,85
�
σ = 8,85 ≈ 2,97
Capítulo 02 Esta.s/ca Descri/va Ø Medidas de Variação
Ø Variância Amostral
Ø Desvio Padrão Amostral
15/08/13 47 © P C F de Oliveira 2013
�
s2 =x − x ( )2∑
n −1
�
s = s2 =x − x ( )2∑
n −1
Soma dos quadrados, SSx
Capítulo 02 Esta.s/ca Descri/va Ø Obtendo a Variância e o Desvio Padrão Amostral
15/08/13 48 © P C F de Oliveira 2013
Em Palavras Em Símbolos
1. Calcule a média do conjunto de dados amostrais.
2. Calcule o desvio de cada entrada.
3. Eleve cada desvio ao quadrado.
4. Some os resultados para obter a soma dos quadrados.
�
SSx = x − x ( )2∑�
x − x ( )2�
x =x∑
n
�
x − x
Capítulo 02 Esta.s/ca Descri/va Ø Obtendo a Variância e o Desvio Padrão Amostral APopulacional
15/08/13 49 © P C F de Oliveira 2013
Em Palavras Em Símbolos
5. Divida por n – 1 para obter a variância amostral.
6. Calcule raiz quadrada para obter o desvio padrão amostral.
�
s2 =x − x ( )2∑
n −1
�
s =x − x ( )2∑
n −1
Capítulo 02 Esta.s/ca Descri/va Ø Exemplo
Ø Os salários iniciais abaixo são para as filiais de Chicago de uma grande empresa. Esta empresa possui outras filiais e você planeja usar esses salários para es\mar os salários iniciais de uma população maior. Calcule o desvio padrão amostral.
Salário inicial (em milhares de dólares) 41 38 39 45 47 41 44 41 37 42
15/08/13 50 © P C F de Oliveira 2013
Capítulo 02 Esta.s/ca Descri/va Ø Solução
Ø Lembre-‐se que:
Ø Calcule SSx Ø n = 10
15/08/13 51 © P C F de Oliveira 2013
�
x = 41510
= 41,5
Σ(x – x) = 0
Salário, x Desvio: x – x Quadrados: (x – x)2 41 41 – 41,5 = –0,5 (–0,5)2 = 0,25 38 38 – 41,5 = –3,5 (–3,5)2 = 12,25 39 39 – 41,5 = –2,5 (–2,5)2 = 6,25 45 45 – 41,5 = 3,5 (3,5)2 = 12,25 47 47 – 41,5 = 5,5 (5,5)2 = 30,25 41 41 – 41,5 = –0,5 (–0,5)2 = 0,25 44 44 – 41,5 = 2,5 (2,5)2 = 6,25 41 41 – 41,5 = –0,5 (–0,5)2 = 0,25 37 37 – 41,5 = –4,5 (–4,5)2 = 20,25 42 42 – 41,5 = 0,5 (0,5)2 = 0,25
SSx= 88,5 �
s2 = 88,510 −1
≈ 9,83
�
s = 9,83 ≈ 3,14
Capítulo 02 Esta.s/ca Descri/va Ø Medidas de Variação
Ø Interpretando o Desvio Padrão Ø Desvio Padrão mede o quanto uma entrada 4pica se desvia da média
Ø Quanto mais espalhadas as entradas estão, maior será o desvio padrão.
15/08/13 52 © P C F de Oliveira 2013
Capítulo 02 Esta.s/ca Descri/va Ø Medidas de Variação
Ø Interpretando o Desvio Padrão Ø Vários conjuntos de dados da vida real têm distribuições com a forma aproximada de um sino.
Ø Existe para isto uma regra empírica para ajudar a ver o desvio padrão como medida de variação Ø Cerca de 68% dos dados estão dentro de 1 desvio padrão da média
Ø Cerca de 95% dos dados estão dentro de 2 desvios padrão da média
Ø Cerca de 99,7% dos dados estão dentro de 3 desvios padrão da média
15/08/13 53 © P C F de Oliveira 2013
Capítulo 02 Esta.s/ca Descri/va Ø Interpretando o Desvio Padrão – Regra Empírica
15/08/13 54 © P C F de Oliveira 2013
x
68% dentro de 1 desvio padrão
34% 34%
99,7% dentro de 3 desvios padrão
2,35% 2,35%
95% dentro de 2 desvios padrão
13,5% 13,5%
�
x − 3s
�
x − 2s
�
x − s
�
x + s
�
x + 2s
�
x + 3s
Capítulo 02 Esta.s/ca Descri/va Ø Exemplo
Ø Em um levantamento conduzido pelo Na\onal Center for Health Sta\s\cs (Centro Nacional de Esta4s\ca da Saúde), a média da amostra de alturas de mulheres nos Estados Unidos com idade entre 20 e 29 anos foi de 64 polegadas, com desvio padrão amostral de 2,75 polegadas. Es\me o percentual de mulheres cujas alturas estão entre 64 e 69,5 polegadas.
15/08/13 55 © P C F de Oliveira 2013
Capítulo 02 Esta.s/ca Descri/va Ø Solução
Ø Como a distribuição possui a forma de sino, usa-‐se a regra empírica
15/08/13 56 © P C F de Oliveira 2013
55,75 58,5 61,25 64 66,75 69,5 72,25
34%
13,5%
x
�
x − 3s
�
x − 2s
�
x − s
�
x + s
�
x + 2s
�
x + 3s
�
x + 2s = 64 + (2 × 2,75) = 69,5
�
34% +13,5% = 47,5%
Capítulo 02 Esta.s/ca Descri/va Ø Medidas de Variação
Ø Interpretando o Desvio Padrão Ø Teorema de Chebychev
Ø A parcela de qualquer conjunto de dados que está dentro de k desvios padrão (k > 1) da média é pelo menos
Ø k = 2: em qualquer conjunto de dados, pelo menos ou 75%
dos dados estão dentro de 2 desvios padrão da média
Ø k = 3: em qualquer conjunto de dados, pelo menos ou
88,9% dos dados estão dentro de 3 desvios padrão da média
15/08/13 57 © P C F de Oliveira 2013
�
1− 1k 2
�
1− 122
= 34
�
1− 132
= 89
Capítulo 02 Esta.s/ca Descri/va Ø Exemplo
Ø A distribuição de idade para a Flórida é mostrada no histograma abaixo. Aplique o Teorema de Chebychev aos dados usando k = 2. O que você pode concluir?
15/08/13 58 © P C F de Oliveira 2013
Capítulo 02 Esta.s/ca Descri/va Ø Solução
15/08/13 59 © P C F de Oliveira 2013
k = 2: µ – 2σ = 39,2 – 2×24,8 = –10,4 µ + 2σ = 39,2 + 2×24,8 = 88,8
(use 0 já que idade não pode ser nega\va)
Pelo menos 75% da população da Flórida está entre 0 e 88,8 anos de idade.
Capítulo 02 Esta.s/ca Descri/va Ø Medidas de Variação
Ø Desvio Padrão para dados agrupados Ø Desvio Padrão Amostral de uma distribuição de frequência
15/08/13 60 © P C F de Oliveira 2013
�
s =x − x ( )2 f∑n −1
�
n = f∑Onde: (Número de entradas no conjunto de dados)
Quando uma distribuição de frequência possui classes, usa-‐se o ponto médio de cada classe para calcular a média e o desvio padrão amostral.
Capítulo 02 Esta.s/ca Descri/va Ø Exemplo
Ø Você coletou uma amostra aleatória do número de crianças por família em uma região. Os resultados estão dispostos na tabela correspondente. Determine a média e o desvio padrão da amostra do conjunto de dados.
15/08/13 61 © P C F de Oliveira 2013
Número de crianças em 50 famílias
1 3 1 1 1
1 2 2 1 0
1 1 0 0 0
1 5 0 3 6
3 0 3 1 1
1 1 6 0 1
3 6 6 1 2
2 3 0 1 1
4 1 1 2 2
0 3 0 2 4
Capítulo 02 Esta.s/ca Descri/va Ø Solução
Ø Primeiro construa a distribuição de freqüência
Ø Calcule a média da freqüência de distribuição
15/08/13 62 © P C F de Oliveira 2013
x f xf 0 10 0×10 = 0 1 19 1×19 = 19 2 7 2×7 = 14 3 7 3×7 =21 4 2 4×2 = 8 5 1 5×1 = 5 6 4 6×4 = 24
n =Σf = 50 Σ(xf ) = 91
�
x =(xf )∑n
= 9150
≈1,8
Capítulo 02 Esta.s/ca Descri/va Ø Solução
Ø Calcule a soma dos quadrados
15/08/13 63 © P C F de Oliveira 2013
x f x – x (x – x)2 (x – x)2f
0 10 0 – 1,8 = –1,8 (–1,8)2 = 3,24 3,24×10 = 32,40 1 19 1 – 1,8 = –0,8 (–0,8)2 = 0,64 0,64×19 = 12,16 2 7 2 – 1,8 = 0,2 (0,2)2 = 0,04 0,04×7 = 0,28 3 7 3 – 1,8 = 1,2 (1,2)2 = 1,44 1,44×7 = 10,08 4 2 4 – 1,8 = 2,2 (2,2)2 = 4,84 4,84×2 = 9,68 5 1 5 – 1,8 = 3,2 (3,2)2 = 10,24 10,24×1 = 10,24 6 4 6 – 1,8 = 4,2 (4,2)2 = 17,64 17,64×4 = 70,56
Σ = 145,4
Capítulo 02 Esta.s/ca Descri/va Ø Solução
Ø Calcule o desvio padrão amostral
15/08/13 64 © P C F de Oliveira 2013
�
s =x − x ( )2 f∑n −1
= 145,450 −1
= 145,449
≈1,7
Capítulo 02 Esta.s/ca Descri/va Ø Medidas de Posição Ø Descrevem a posição de um valor de dados específico possui em relação ao resto dos dados
Ø Mais usadas Ø Quar\s Ø Percen\s Ø Decis Ø Escore padrão (z-‐score)
15/08/13 66 © P C F de Oliveira 2013
Capítulo 02 Esta.s/ca Descri/va Ø Medidas de Posição
Ø Frac/s são números que dividem um conjunto de dados ordenado em partes iguais
Ø Quar/s são números que dividem um conjunto de dados ordenado em 4 partes iguais Ø Primeiro quar/l – Q1: cerca de um quarto dos dados fica
dentro ou abaixo Ø Segundo quar/l – Q2: cerca da metade dos dados fica dentro
ou abaixo (mediana) Ø Terceiro quar/l – Q3: cerca de três quartos dos dados fica
dentro ou abaixo
15/08/13 67 © P C F de Oliveira 2013
Capítulo 02 Esta.s/ca Descri/va Ø Exemplo
Ø A pontuação nos testes de 15 empregados envolvidos em um curso de treinamento está disposto a seguir. Obtenha o primeiro, segundo e terceiro quar\s da pontuação dos testes.
15/08/13 68 © P C F de Oliveira 2013
13 9 18 15 14 21 7 10 11 20 5 18 37 16 17
Capítulo 02 Esta.s/ca Descri/va Ø Solução
Ø Primeiro ordene os dados e obtenha Q2
Ø Q2 divide o conjunto de dados em 2 metades (mediana)
15/08/13 69 © P C F de Oliveira 2013
5 7 9 10 11 13 14 15 16 17 18 18 20 21 37
Q2
Metade Inferior Metade Superior
Capítulo 02 Esta.s/ca Descri/va Ø Solução
Ø O primeiro (Q1) e terceiro (Q3) quar\s são as medianas das metades inferior e superior
Ø Cerca de um quarto dos empregados fez 10 pontos ou menos, cerca da metade fez 15 pontos ou menos e cerca de três quartos conseguiu 18 pontos ou menos.
15/08/13 70 © P C F de Oliveira 2013
5 7 9 10 11 13 14 15 16 17 18 18 20 21 37
Q2
Metade Inferior Metade Superior
Q1 Q3
Capítulo 02 Esta.s/ca Descri/va Ø Medidas de Posição
Ø Amplitude Interquar/l (AIQ) Ø Diferença entre o terceiro e o primeiro quar\s
15/08/13 71 © P C F de Oliveira 2013
�
AIQ = Q3 −Q1
Capítulo 02 Esta.s/ca Descri/va Ø Exemplo
Ø Obtenha a amplitude interquar\l da pontuação nos 15 testes dados no exemplo anterior.
15/08/13 72 © P C F de Oliveira 2013
Capítulo 02 Esta.s/ca Descri/va Ø Solução
Ø Lembre-‐se que
Q1 = 10, Q2 = 15, e Q3 = 18
Ø Então
Ø Isso significa que as pontuações no teste na metade do conjunto de dados variam no máximo em 8 pontos.
15/08/13 73 © P C F de Oliveira 2013
�
AIQ = Q3 −Q1 =18 −10 = 8
Capítulo 02 Esta.s/ca Descri/va Ø Medidas de Posição
Ø Plote Maria-‐Chiquinha (Box-‐and-‐whisker plot) Ø Ferramenta de análise exploratória de dados Ø Realça caracterís\cas importantes de um conjunto de
dados Ø Requer os seguintes valores (resumo cinco-‐números)
Ø Entrada mínima Ø Primeiro quar\l Q1 Ø Mediana Q2 Ø Terceiro quar\l Q3 Ø Entrada máxima
15/08/13 74 © P C F de Oliveira 2013
Capítulo 02 Esta.s/ca Descri/va Ø Desenhando um Plote Maria-‐Chiquinha
Ø Obtenha o resumo cinco-‐números Ø Construa uma escala horizontal que abranja a amplitude total (AT)
dos dados Ø Plote os 5 números acima da escala horizontal Ø Faça uma caixa acima da escala horizontal de Q1 a Q3 e trace uma
reta ver\cal na caixa passando por Q2 Ø Faça as tranças a par\r da caixa para as entradas mínima e
máxima
15/08/13 75 © P C F de Oliveira 2013
Trança Trança
Entrada máxima
Entrada mínima
Caixa
Mediana, Q2 Q3 Q1
Capítulo 02 Esta.s/ca Descri/va Ø Exemplo
Ø Faça um plote maria-‐chiquinha que represente a pontuação dos 15 testes dados no exemplo anterior. O que você pode concluir do gráfico?
15/08/13 76 © P C F de Oliveira 2013
5 7 9 10 11 13 14 15 16 17 18 18 20 21 37
Capítulo 02 Esta.s/ca Descri/va Ø Solução
Ø O resumo cinco-‐números das pontuações
Ø Cerca da metade das pontuações está entre 10 e 18. Ø Olhando para o comprimento da trança direita pode-‐se
concluir que 37 é um possível dado discrepante (outlier).
15/08/13 77 © P C F de Oliveira 2013
Min = 5 Q1 = 10 Q2 = 15 Q3 = 18 Max = 37
5 10 15 18 37
Capítulo 02 Esta.s/ca Descri/va Ø Medidas de Posição
Ø Percen/s e outros frac/s
15/08/13 78 © P C F de Oliveira 2013
Frac/s Resumo Símbolos Quar\s Divide o conjunto de dados
em 4 partes iguais Q1, Q2, Q3
Decis Divide o conjunto de dados em 10 partes iguais
D1, D2, D3,…, D9
Percen\s Divide o conjunto de dados em 100 partes iguais
P1, P2, P3,…, P99
Capítulo 02 Esta.s/ca Descri/va
Ø Exemplo – Interpretando os percen/s Ø O gráfico de freqüência
acumulada para a pontuação no teste SAT (teste de lógica) do ano 2000 está representado no gráfico. Que pontuação representa o 72° percen\l? Como interpretar isso? (Fonte: College Board Online)
15/08/13 79 © P C F de Oliveira 2013
Capítulo 02 Esta.s/ca Descri/va Ø Solução
Ø O 72° percen\l corresponde a uma pontuação no teste de 1700
Ø Isto significa que 72% dos estudantes \veram uma pontuação no SAT de 1700 ou menos
15/08/13 80 © P C F de Oliveira 2013
Capítulo 02 Esta.s/ca Descri/va Ø Medidas de Posição
Ø Escore Padrão (z-‐score ou escore-‐z) Ø Representa o número de desvios padrão no qual está um valor dado x a par\r da média m.
15/08/13 81 © P C F de Oliveira 2013
�
z = valor −médiadesvio padrão
= x − µσ
Capítulo 02 Esta.s/ca Descri/va Ø Exemplo 1
Ø A velocidade média dos veículos ao longo de um trecho de uma estrada é de 56 milhas por hora (mph), com desvio padrão de 4 mph. Foram medidas as velocidades de 3 carros ao longo da estrada, obtendo-‐se respec\vamente 62 mph, 47 mph e 56 mph. Calcule o escore z correspondente a cada velocidade. O que você pode concluir?
15/08/13 82 © P C F de Oliveira 2013
Capítulo 02 Esta.s/ca Descri/va Ø Solução
Ø Conclui-‐se que a velocidade de 62 mph está 1,5 desvios padrão acima da média, a de 47 mph está 2,25 desvios padrão abaixo da média e a de 56 mph é igual à média
15/08/13 83 © P C F de Oliveira 2013
x = 62 mph x = 47 mph x = 56 mph
�
z = 62 − 564
=1,5
�
z = 47 − 564
= −2,25
�
z = 56 − 564
= 0
Capítulo 02 Esta.s/ca Descri/va
Ø Exemplo 2 Ø Em 2007, o ator Forest Whitaker ganhou o Oscar de melhor
ator, aos 45 anos de idade, por sua atuação no filme O Úl4mo Rei da Escócia. A atriz Helen Mirren ganhou o prêmio de melhor atriz aos 61 anos por seu papel em A Rainha. A idade média para todos os vencedores do prêmio de melhor ator é 43,7, com desvio padrão de 8,8. A idade média para as vencedoras do prêmio de melhor atriz é 36, com desvio padrão de 11,5. Encontre o escore z que corresponda à idade de cada ator ou atriz. Depois, compare os resultados.
15/08/13 84 © P C F de Oliveira 2013
Capítulo 02 Esta.s/ca Descri/va Ø Solução
15/08/13 85 © P C F de Oliveira 2013
Ø Forest Whitaker 45 43.7 0.158.8
xz µσ− −= = ≈
Ø Helen Mirren 61 36 2.1711.5
xz µσ− −= = ≈
Desvio padrão 0,15 acima da média
Desvio padrão 2,17 acima da média
Capítulo 02 Esta.s/ca Descri/va Ø Solução
15/08/13 86 © P C F de Oliveira 2013
Escores muito incomuns Escores não comuns Escores comuns Escore z
z = 0.15 z = 2.17
O escore z correspondente à idade de Helen Mirren é mais de dois desvios padrão da média, então é considerado incomum. Comparado a outras vencedoras do prêmio de melhor atriz, ela é rela\vamente mais velha, enquanto a idade de Forest Whitaker é pouco acima da média dos ganhadores do prêmio de melhor ator.