29
Estatística e Probabilidade Estatística Descritiva (Teoria) Rev2 www.portaleletronica.com.br 1 1. Introdução às distribuições normais e à distribuição normal padrão Normalmente, os pesquisadores precisam trabalhar com dados amostrais a fim de analisar populações, mas, algumas vezes, é possível coletar todos os dados para certa população. Exemplo 1.1: Os dados a seguir representam as idades das 50 mulheres mais influentes do mundo, em 2012. (Fonte: Forbes.) 26, 31, 35, 37, 43, 43, 43, 44, 45, 47, 48, 48, 49, 50, 51, 51, 51, 51, 52, 54, 54, 54, 54, 55, 55, 55, 56, 57, 57, 57, 58, 58, 58, 58, 59. 59, 59, 62, 62, 63, 64, 65, 65, 65, 66, 66, 67, 67, 72, 86. O objetivo é tornar os dados mais fáceis de serem entendidos descrevendo tendências, medidas centrais e variações. Por exemplo, nos dados brutos que mostram as idades das 50 mulheres mais influentes do mundo em 2012, não é fácil ver um padrão ou característica em especial. Na Tabela 1.1 e na Figura 1.1 estão algumas maneiras de organizar e descrever os dados. Tabela 1.1 Figura 1.1

Estatística e Probabilidade Estatística Descritiva www ... · Estatística e Probabilidade Estatística Descritiva (Teoria) – Rev2 1 1. Introdução às distribuições normais

  • Upload
    others

  • View
    49

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Estatística e Probabilidade Estatística Descritiva www ... · Estatística e Probabilidade Estatística Descritiva (Teoria) – Rev2 1 1. Introdução às distribuições normais

Estatística e Probabilidade

Estatística Descritiva (Teoria) – Rev2

www.portaleletronica.com.br

1

1. Introdução às distribuições normais e à distribuição normal padrão

Normalmente, os pesquisadores precisam trabalhar com dados amostrais a fim de

analisar populações, mas, algumas vezes, é possível coletar todos os dados para

certa população.

Exemplo 1.1:

Os dados a seguir representam as idades das 50 mulheres mais influentes do mundo,

em 2012. (Fonte: Forbes.)

26, 31, 35, 37, 43, 43, 43, 44, 45, 47, 48, 48, 49, 50, 51, 51, 51, 51, 52, 54, 54, 54, 54,

55, 55, 55, 56, 57, 57, 57, 58, 58, 58, 58, 59. 59, 59, 62, 62, 63, 64, 65, 65, 65, 66, 66,

67, 67, 72, 86.

O objetivo é tornar os dados mais fáceis de serem entendidos descrevendo

tendências, medidas centrais e variações. Por exemplo, nos dados brutos que

mostram as idades das 50 mulheres mais influentes do mundo em 2012, não é fácil

ver um padrão ou característica em especial. Na Tabela 1.1 e na Figura 1.1 estão

algumas maneiras de organizar e descrever os dados.

Tabela 1.1

Figura 1.1

Page 2: Estatística e Probabilidade Estatística Descritiva www ... · Estatística e Probabilidade Estatística Descritiva (Teoria) – Rev2 1 1. Introdução às distribuições normais

Estatística e Probabilidade

Estatística Descritiva (Teoria) – Rev2

www.portaleletronica.com.br

2

Você aprenderá que há muitas maneiras para se organizar e descrever um conjunto

de dados. Algumas características importantes que devem ser consideradas quando

organizamos e descrevemos um conjunto de dados são seu centro, sua variabilidade

(ou dispersão) e sua forma.

Quando um conjunto de dados tem muitos valores, pode ser difícil de observar

padrões. Nesta seção, você aprenderá como organizar conjuntos de dados

agrupando-os em intervalos chamados de classes e formando uma distribuição de

frequência. Você também aprenderá como usar as distribuições de frequência para a

construção de gráficos.

Na distribuição de frequência mostrada na Tabela 1.2 há seis classes. As frequências

para cada uma das seis classes são 5, 8, 6, 8, 5 e 4. Cada classe tem um limite inferior

de classe, que é o menor número que pode pertencer à classe, e um limite superior

de classe, que é o maior número que pode pertencer à classe. Na distribuição de

frequência mostrada, os limites inferiores de classe são 1, 6, 11, 16, 21 e 26 e os

limites superiores de classe são 5, 10, 15, 20, 25 e 30. A amplitude de classe é a

distância entre os limites inferiores (ou superiores) de classes consecutivas. Por

Page 3: Estatística e Probabilidade Estatística Descritiva www ... · Estatística e Probabilidade Estatística Descritiva (Teoria) – Rev2 1 1. Introdução às distribuições normais

Estatística e Probabilidade

Estatística Descritiva (Teoria) – Rev2

www.portaleletronica.com.br

3

exemplo, a amplitude de classe na distribuição de frequência mostrada é 6 – 1 = 5.

Note que as classes não se sobrepõem.

A diferença entre os valores máximo e mínimo dos dados é chamada de amplitude.

Na tabela de frequência mostrada, suponha que o valor máximo seja 29, e o mínimo

seja 1. A amplitude é, então, 29 – 1 = 28.

Tabela 1.2 Exemplo de uma distribuição de frequência.

Exemplo 1.2:

Construindo uma distribuição de frequência com base em um conjunto de dados.

O conjunto de dados a seguir lista os preços (em dólares) de 30 aparelhos GPS (global

positioning system) portáteis. Construa uma distribuição de frequência com sete

classes.

Solução

1. O número de classes (7) é dado no problema.

2. O valor mínimo é 65 e o máximo é 340, então, a amplitude é 340 – 65 = 275. Divida

a amplitude pelo número de classes e arredonde para encontrar a amplitude de

classe.

Page 4: Estatística e Probabilidade Estatística Descritiva www ... · Estatística e Probabilidade Estatística Descritiva (Teoria) – Rev2 1 1. Introdução às distribuições normais

Estatística e Probabilidade

Estatística Descritiva (Teoria) – Rev2

www.portaleletronica.com.br

4

3. O valor mínimo é um limite inferior conveniente para a primeira classe. Para

encontrar os limites inferiores das seis classes restantes, adicione a amplitude de

classe, 40, ao limite inferior de cada classe precedente. Logo, os limites inferiores

das demais classes são: 65 + 40 = 105, 105 + 40 = 145, e assim por diante. O

limite superior da primeira classe é 104, que é uma unidade a menos que o limite

inferior da segunda classe. Os limites superiores das outras classes são: 104 + 40

= 144, 144 + 40 = 184, e assim por diante. Os limites inferiores e superiores para

todas as sete classes são mostrados na Tabela 1.3.

Tabela 1.3 Limites das classes.

Exemplo: quantidade entre 105 e 144, frequência igual a 9

Page 5: Estatística e Probabilidade Estatística Descritiva www ... · Estatística e Probabilidade Estatística Descritiva (Teoria) – Rev2 1 1. Introdução às distribuições normais

Estatística e Probabilidade

Estatística Descritiva (Teoria) – Rev2

www.portaleletronica.com.br

5

Encontrando pontos médios, frequências relativas e frequências acumuladas.

Solução:

Os pontos médios e as frequências relativas e acumuladas para as três primeiras

classes são:

Page 6: Estatística e Probabilidade Estatística Descritiva www ... · Estatística e Probabilidade Estatística Descritiva (Teoria) – Rev2 1 1. Introdução às distribuições normais

Estatística e Probabilidade

Estatística Descritiva (Teoria) – Rev2

www.portaleletronica.com.br

6

Os demais pontos médios e frequências relativas e acumuladas são mostradas na

distribuição de frequência expandida.

Interpretação: Há diversos padrões no conjunto de dados. Por exemplo, o preço mais

comum de navegador GPS encontra-se no intervalo de US$ 105 a US$ 144. Além

disso, metade dos navegadores GPS custa menos que US$ 145.

Exemplo 1.3:

Lendo uma distribuição de frequência. Use a distribuição de frequência dada para

determinar:

a) a amplitude das classes;

b) os pontos médios das classes;

c) frequência relativa

d) frequência acumulada

Temperaturas altas (Farad) em Cleveland, Ohio.

Page 7: Estatística e Probabilidade Estatística Descritiva www ... · Estatística e Probabilidade Estatística Descritiva (Teoria) – Rev2 1 1. Introdução às distribuições normais

Estatística e Probabilidade

Estatística Descritiva (Teoria) – Rev2

www.portaleletronica.com.br

7

Solução:

Classes Frequência,

𝑓

Amplitude

das Classes

Pontos

Médios

Frequência

relativa

Frequência

Acumulada

20 - 30 19

31 - 41 43

42 - 52 68

53 - 63 69

64 - 74 74

75 - 85 68

86 - 96 24

𝚺𝒇 =

𝚺𝒇

𝒏≈ 𝟏

Exemplo 1.4:

Lendo uma distribuição de frequência. Use a distribuição de frequência dada para

determinar:

a) a amplitude das classes;

b) os pontos médios das classes;

c) frequência relativa

d) frequência acumulada

Tempo de deslocamento até o trabalho (em minutos).

Page 8: Estatística e Probabilidade Estatística Descritiva www ... · Estatística e Probabilidade Estatística Descritiva (Teoria) – Rev2 1 1. Introdução às distribuições normais

Estatística e Probabilidade

Estatística Descritiva (Teoria) – Rev2

www.portaleletronica.com.br

8

Solução:

Classes Frequência,

𝑓

Amplitude

das Classes

Pontos

Médios

Frequência

relativa

Frequência

Acumulada

0 - 9 188

10 - 19 372

20 - 29 264

30 - 39 205

40 - 49 83

50 - 59 76

60 - 69 32

𝚺𝒇 =

𝚺𝒇

𝒏≈ 𝟏

2. Medidas de Tendência Central

Aprenderemos sobre como complementar as representações gráficas com

estatísticas numéricas que descrevem o centro e a variabilidade de um conjunto de

dados.

Uma medida de tendência central é um valor que representa uma observação

típica ou central de um conjunto de dados. As três medidas da tendência central mais

comumente usadas são a média, a mediana e a moda.

Page 9: Estatística e Probabilidade Estatística Descritiva www ... · Estatística e Probabilidade Estatística Descritiva (Teoria) – Rev2 1 1. Introdução às distribuições normais

Estatística e Probabilidade

Estatística Descritiva (Teoria) – Rev2

www.portaleletronica.com.br

9

Exemplo 2.1:

Encontrando a média amostral.

Os pesos (em libras) de uma amostra de adultos antes de iniciarem um estudo sobre

perda de peso estão listados. Qual é o peso médio dos adultos?

274 235 223 268 290 285 235

Solução:

A soma dos pesos é:

Σx = 274 + 235 + 223 + 268 + 290 + 285 + 235 = 1.810

Há 7 adultos na amostra, logo n = 7. Para encontrar o peso médio, divida a soma dos

pesos pelo número de adultos na amostra.

Então, o peso médio dos adultos é aproximadamente 258,6 libras.

Exemplo 2.2:

Encontrando a mediana.

Encontre a mediana para os pesos listados no Exemplo 2.1.

274 235 223 268 290 285 235

Page 10: Estatística e Probabilidade Estatística Descritiva www ... · Estatística e Probabilidade Estatística Descritiva (Teoria) – Rev2 1 1. Introdução às distribuições normais

Estatística e Probabilidade

Estatística Descritiva (Teoria) – Rev2

www.portaleletronica.com.br

10

Solução:

Para encontrar o peso mediano, primeiro ordene os dados.

223 235 235 268 274 285 290

Em razão de termos sete observações (um número ímpar), a mediana está no meio,

é a quarta observação. Então, o peso mediano é 268 libras.

Exemplo 2.3:

Encontrando a mediana.

No Exemplo 2.1, o adulto pesando 285 libras decide não participar do estudo. Qual é

o peso mediano dos adultos restantes?

274 235 223 268 290 285 235

Solução:

Os pesos restantes em ordem são:

223 235 235 268 274 290

Em razão de termos seis observações (um número par), a mediana é a média dos

dois elementos do meio.

Então, o peso mediano dos adultos restantes é 251,5 libras.

Exemplo 2.4:

Os preços (em dólares) de uma amostra de porta-retratos digital estão listados a

seguir.

70 10 50 130 80 100 50 120 100 70

a) Ordene os dados.

b) Determine a média amostral dos preços dos porta-retratos.

c) Determine o preço mediano dos porta-retratos.

Solução: ?????????

Page 11: Estatística e Probabilidade Estatística Descritiva www ... · Estatística e Probabilidade Estatística Descritiva (Teoria) – Rev2 1 1. Introdução às distribuições normais

Estatística e Probabilidade

Estatística Descritiva (Teoria) – Rev2

www.portaleletronica.com.br

11

Entenda

A moda é a única medida de tendência central que pode ser usada para descrever

dados no nível nominal de mensuração. Mas, quando trabalhamos com dados

quantitativos, ela é raramente utilizada.

Exemplo 2.5:

Encontrando a moda.

Encontre a moda dos pesos listados no Exemplo 2.1.

274 235 223 268 290 285 235

Solução:

Para encontrar a moda, primeiro ordene os dados.

223 235 235 268 274 285 290

A partir dos dados ordenados, podemos ver que o valor 235 ocorre duas vezes,

enquanto os demais ocorrem somente uma vez. Então, a moda dos pesos é 235 libras.

Exemplo 2.6:

Encontrando a moda.

Em um debate político nos Estados Unidos, pede-se a uma amostra dos membros da

plateia que indique o partido político ao qual pertencem.

Suas respostas são mostradas na Tabela abaixo. Qual é a moda das respostas?

Preferência por partido político em uma amostra de membros de um debate.

Page 12: Estatística e Probabilidade Estatística Descritiva www ... · Estatística e Probabilidade Estatística Descritiva (Teoria) – Rev2 1 1. Introdução às distribuições normais

Estatística e Probabilidade

Estatística Descritiva (Teoria) – Rev2

www.portaleletronica.com.br

12

Solução:

A resposta que ocorre com maior frequência é “Democrata”. Então, a moda é Partido

Democrata.

Interpretação: Nessa amostra havia mais democratas do que pessoas de qualquer

outra afiliação.

Exemplo 2.7:

condomínios de South Beach (Miami Beach, Flórida) estão listados a seguir.

Determine a moda dos preços.

a. Ordene os dados.

b. Identifique o valor ou valores que ocorrem com maior frequência.

c. Interprete os resultados no contexto dos dados.

Solução: ?????????

Page 13: Estatística e Probabilidade Estatística Descritiva www ... · Estatística e Probabilidade Estatística Descritiva (Teoria) – Rev2 1 1. Introdução às distribuições normais

Estatística e Probabilidade

Estatística Descritiva (Teoria) – Rev2

www.portaleletronica.com.br

13

Embora a média, a mediana e a moda descrevam, cada uma, um valor típico de um

conjunto de dados, há vantagens e desvantagens em seus usos.

A média é uma medida mais usual e confiável, pois leva em conta cada elemento de

um conjunto de dados. Contudo, a média pode ser muito afetada quando o conjunto

de dados contém valores discrepantes (outliers).

Enquanto alguns outliers são dados válidos, outros podem ocorrer por causa de erros

no registro dos dados. Um conjunto de dados pode ter um ou mais outliers, causando

lacunas em uma distribuição. As conclusões que são tomadas de um conjunto de

dados que contém outliers podem ser falhas.

Exemplo 2.8:

Comparando a média, a mediana e a moda.

Encontre a média, a mediana e a moda da amostra das idades dos alunos de uma

turma mostradas na Tabela. Qual medida de tendência central melhor descreve um

valor típico (representante) desse conjunto de dados? Há outliers?

Solução:

Page 14: Estatística e Probabilidade Estatística Descritiva www ... · Estatística e Probabilidade Estatística Descritiva (Teoria) – Rev2 1 1. Introdução às distribuições normais

Estatística e Probabilidade

Estatística Descritiva (Teoria) – Rev2

www.portaleletronica.com.br

14

Mediana: Em razão de termos 20 observações (um número par), a mediana é a média

dos dois elementos do meio.

20 20 20 20 20 20 21 21 21 21 22 22 22 23 23 23 23 24 24 65

Moda: o valor que ocorre com maior frequência é 20 anos.

20 20 20 20 20 20 21 21 21 21 22 22 22 23 23 23 23 24 24 65

Interpretação A média leva em consideração todos os valores, mas é influenciada

pelo outlier de valor 65. A mediana também leva em consideração todos os valores, e

não é afetada pelo outlier. Nesse caso, a moda existe, mas não parece representar

um valor típico (região central). Algumas vezes, uma comparação gráfica pode ajudar

a decidir qual medida de tendência central melhor representa o conjunto de dados.

O histograma da Figura apresenta a distribuição dos dados e a localização da média,

da mediana e da moda. Nesse caso, a mediana parece representar melhor o conjunto

de dados.

Histograma representativo das idades dos alunos de uma turma mostrando medidas

de tendência central e outlier.

Page 15: Estatística e Probabilidade Estatística Descritiva www ... · Estatística e Probabilidade Estatística Descritiva (Teoria) – Rev2 1 1. Introdução às distribuições normais

Estatística e Probabilidade

Estatística Descritiva (Teoria) – Rev2

www.portaleletronica.com.br

15

Exemplo 2.9:

Remova o valor 65 do conjunto de dados do Exemplo 2.8. Então, refaça o exemplo.

Como a ausência desse outlier muda cada uma das medidas?

a. Encontre a média, a mediana e a moda.

b. Compare essas medidas de tendência central com as do Exemplo 7.

Solução: ?????????

3. Média ponderada e média de dados agrupados

Às vezes, os conjuntos de dados possuem valores que têm um efeito maior na média

do que outros. Para calcular a média de tais conjuntos, você deve encontrar a média

ponderada.

Definição:

Uma média ponderada é a média de um conjunto de dados cujos valores têm pesos

variados. A média ponderada é dada por:

�̅� =Σ(𝑥. 𝑦)

Σ𝑤

em que w é o peso de cada valor de x.

Exemplo 3.1:

Você está frequentando uma disciplina na qual sua nota é determinada com base em

5 fontes:

• 50% da média de seu teste;

• 15% de sua prova bimestral;

Page 16: Estatística e Probabilidade Estatística Descritiva www ... · Estatística e Probabilidade Estatística Descritiva (Teoria) – Rev2 1 1. Introdução às distribuições normais

Estatística e Probabilidade

Estatística Descritiva (Teoria) – Rev2

www.portaleletronica.com.br

16

• 20% de sua prova final;

• 10% de seu trabalho no laboratório de informática e;

• 5% de seus deveres de casa.

Suas notas são: 86 (média do teste), 96 (prova bimestral), 82 (prova final), 98

(laboratório) e 100 (dever de casa). Qual é a média ponderada de suas notas?

Solução

Comece organizando os dados e os pesos em uma tabela.

�̅� =Σ(𝑥. 𝑦)

Σ𝑤=

88,6

1= 88,6

Sua média ponderada para o curso é 88,6.

Exemplo 3.2:

Houve um erro no cálculo da nota de seu prova final. Em vez de 82, você obteve 98.

Qual é a sua nova média ponderada?

a) Multiplique cada nota por seu peso e encontre a soma desses produtos.

b) Determine a soma dos pesos.

c) Calcule a média ponderada.

d) Interprete os resultados no contexto dos dados.

Solução: ????????

Page 17: Estatística e Probabilidade Estatística Descritiva www ... · Estatística e Probabilidade Estatística Descritiva (Teoria) – Rev2 1 1. Introdução às distribuições normais

Estatística e Probabilidade

Estatística Descritiva (Teoria) – Rev2

www.portaleletronica.com.br

17

Para dados apresentados em uma distribuição de frequência, você pode aproximar a

média como mostrado na próxima definição.

Definição:

A média de uma distribuição de frequência para uma amostra é aproximada por:

�̅� =Σ(𝑥. 𝑓)

n 𝒏𝒐𝒕𝒂 𝒒𝒖𝒆 𝒏 = 𝚺𝒇

em que x e f são os pontos médios e as frequências de cada classe, respectivamente.

Encontrando a média de uma distribuição de frequência

1) Determine o ponto médio de cada

classe.

𝑥 =𝑙𝑖𝑚𝑖𝑡𝑒 𝑖𝑛𝑓𝑒𝑟𝑖𝑜𝑟 − 𝑙𝑖𝑚𝑖𝑡𝑒 𝑠𝑢𝑝𝑒𝑟𝑖𝑜𝑟

2

2) Calcule a soma dos produtos dos

pontos médios pelas frequências

Σ(𝑥. 𝑓)

3) Calcule a soma das frequências.

n = Σ𝑓

4) Determine a média da distribuição

de frequência. �̅� =

Σ(𝑥. 𝑓)

𝑛

Exemplo 3.3:

Encontrando a média de uma distribuição de frequência.

Use a distribuição de frequência da tabela para aproximar o número médio de minutos

que uma amostra de usuários de internet gastou on-line durante sua mais recente

conexão.

Dados e operações para o cálculo da média em dados agrupados em classes.

Page 18: Estatística e Probabilidade Estatística Descritiva www ... · Estatística e Probabilidade Estatística Descritiva (Teoria) – Rev2 1 1. Introdução às distribuições normais

Estatística e Probabilidade

Estatística Descritiva (Teoria) – Rev2

www.portaleletronica.com.br

18

Ponto médio

das classes, 𝑥

Frequência,

𝑓 𝑥. 𝑓

12,5 6 75,0

24,5 10 245,0

36,5 13 474,5

48,5 8 388,0

60,5 5 302,5

72,5 6 435,0

84,5 2 169,0

𝒏 = 𝟓𝟎 𝚺 = 𝟐𝟎𝟖𝟗

Solução:

�̅� =Σ(𝑥. 𝑓)

𝑛=

2089

50 ≈ 41,8

Logo, o tempo médio gasto on-line foi de aproximadamente 41,8 minutos.

Exemplo 3.4:

Use uma distribuição de frequência para aproximar a idade média das 50 mulheres

mais influentes do mundo conforme exercício resolvido 1.1.

Os dados a seguir representam as idades das 50 mulheres mais influentes do mundo,

em 2012. (Fonte: Forbes.)

26, 31, 35, 37, 43, 43, 43, 44, 45, 47, 48, 48, 49, 50, 51, 51, 51, 51, 52, 54, 54, 54, 54,

55, 55, 55, 56, 57, 57, 57, 58, 58, 58, 58, 59. 59, 59, 62, 62, 63, 64, 65, 65, 65, 66, 66,

67, 67, 72, 86.

Page 19: Estatística e Probabilidade Estatística Descritiva www ... · Estatística e Probabilidade Estatística Descritiva (Teoria) – Rev2 1 1. Introdução às distribuições normais

Estatística e Probabilidade

Estatística Descritiva (Teoria) – Rev2

www.portaleletronica.com.br

19

a) Determine o ponto médio de cada classe.

b) Calcule a soma dos produtos de cada ponto médio e sua frequência

correspondente.

c) Calcule a soma das frequências.

d) Determine a média da distribuição de frequência.

Solução: ?????

Page 20: Estatística e Probabilidade Estatística Descritiva www ... · Estatística e Probabilidade Estatística Descritiva (Teoria) – Rev2 1 1. Introdução às distribuições normais

Estatística e Probabilidade

Estatística Descritiva (Teoria) – Rev2

www.portaleletronica.com.br

20

4. Medidas de Variação (dispersão)

Amplitude

Vamos aprender as diferentes maneiras de medir a variação (ou dispersão) de um

conjunto de dados. A medida mais simples é a amplitude do conjunto.

Exemplo 4.1:

Encontrando a amplitude de um conjunto de dados.

Duas empresas contrataram 10 formandos cada. O salário inicial para cada formando

é mostrado nas tabelas (a) e (b). Encontre a amplitude dos salários iniciais para a

empresa A.

(a) Salários iniciais para a empresa A (em milhares de dólares).

(b) Salários iniciais para a empresa B (em milhares de dólares).

Solução:

a) Ordenar os dados ajuda a encontrar os salários mínimos e máximos.

Amplitude = (salário máximo) – (salário mínimo)

Amplitude = 47 – 37

Page 21: Estatística e Probabilidade Estatística Descritiva www ... · Estatística e Probabilidade Estatística Descritiva (Teoria) – Rev2 1 1. Introdução às distribuições normais

Estatística e Probabilidade

Estatística Descritiva (Teoria) – Rev2

www.portaleletronica.com.br

21

Amplitude = 10

Então, a amplitude dos salários iniciais para a empresa A é 10 ou US$ 10.000.

b) Ordenar os dados ajuda a encontrar os salários mínimos e máximos.

23 29 32 40 41 41 49 50 52 58

Amplitude = (salário máximo) – (salário mínimo)

Amplitude = 58 – 23

Amplitude = 35

c) Ambos os conjuntos de dados têm média de 41,5, ou US$ 41.500, mediana de 41,

ou US$ 41.000, e moda de 41, ou US$ 41.000. E ainda os dois conjuntos diferem

significantemente. A diferença é que os valores no segundo conjunto têm uma

variação maior. Como pode ser observado nas figuras (a) e (b), os salários iniciais

para a empresa B estão mais dispersos que os da empresa A.

Histograma representativo dos salários iniciais das empresas A e B.

(a) Empresa A.

(b) Empresa B.

Page 22: Estatística e Probabilidade Estatística Descritiva www ... · Estatística e Probabilidade Estatística Descritiva (Teoria) – Rev2 1 1. Introdução às distribuições normais

Estatística e Probabilidade

Estatística Descritiva (Teoria) – Rev2

www.portaleletronica.com.br

22

5. Variância e desvio padrão

Como uma medida de variação, a amplitude tem a vantagem de ser fácil de

calcular. Sua desvantagem, entretanto, é que ela usa somente dois valores do

conjunto de dados.

Duas medidas de variação que usam todos os valores do conjunto de dados são:

• a variância;

• e o desvio padrão.

Porém, antes de aprendermos essas medidas, precisamos entender o que

chamamos desvio de um valor no conjunto de dados.

Considere os salários iniciais da empresa A do Exemplo 4.1.

O salário inicial médio é 𝜇 = 415/10 = 41,5 ou US$ 41.500. A Tabela abaixo lista

os desvios de cada salário em relação à média.

Por exemplo, o desvio de 41 é 41 – 41,5 = –0,5.

Page 23: Estatística e Probabilidade Estatística Descritiva www ... · Estatística e Probabilidade Estatística Descritiva (Teoria) – Rev2 1 1. Introdução às distribuições normais

Estatística e Probabilidade

Estatística Descritiva (Teoria) – Rev2

www.portaleletronica.com.br

23

Note que a soma dos desvios é 0. De fato, a soma dos desvios para qualquer

conjunto de dados é 0. Então, não faz sentido encontrar a média dos desvios.

Para superar esse problema, tomamos o quadrado de cada desvio. A soma dos

quadrados dos desvios, ou soma dos quadrados, é indicada por SSx. Em uma

população, a média dos quadrados dos desvios é a variância populacional.

Como uma medida de variação, uma desvantagem da variância é que sua

unidade de medida é diferente da unidade de medida do conjunto de dados.

Por exemplo, a variância para os salários iniciais (em milhares de dólares) no

Exemplo 4.1 é medida em “milhares de dólares quadrados”. Para superar esse

problema, tiramos a raiz quadrada da variância para obter o desvio padrão.

Algumas observações sobre o desvio padrão.

• O desvio padrão mede a variação dos dados com relação à média e tem a

mesma unidade de medida que o conjunto de dados.

• O desvio padrão é sempre maior ou igual a 0. Quando 𝜎 = 0, o conjunto de

dados não apresenta variação (todos os elementos têm o mesmo valor).

• À medida que os valores se afastam da média (isto é, estão mais dispersos), o

valor de 𝜎 aumenta.

Page 24: Estatística e Probabilidade Estatística Descritiva www ... · Estatística e Probabilidade Estatística Descritiva (Teoria) – Rev2 1 1. Introdução às distribuições normais

Estatística e Probabilidade

Estatística Descritiva (Teoria) – Rev2

www.portaleletronica.com.br

24

Para encontrar a variância e o desvio padrão de um conjunto de dados populacional,

siga as instruções a seguir.

Exemplo 5.1:

Encontre a variância e o desvio padrão populacionais dos salários iniciais para a

empresa A. Dados no Exemplo 4.1.

Salários iniciais para a empresa A (em milhares de dólares).

Solução:

Para esse conjunto de dados, N = 10 e Σx = 415. A média é m = 415/10 = 41,5. A

Tabela resume os passos usados para encontrar 𝑆𝑆𝑥.

Soma dos quadrados dos desvios relativos aos salários iniciais para a empresa A.

Page 25: Estatística e Probabilidade Estatística Descritiva www ... · Estatística e Probabilidade Estatística Descritiva (Teoria) – Rev2 1 1. Introdução às distribuições normais

Estatística e Probabilidade

Estatística Descritiva (Teoria) – Rev2

www.portaleletronica.com.br

25

𝑆𝑆𝑥 = 88,5 𝜎2 =88,5

10≈ 8,9 𝜎 = ඨ

88,5

10≈ 3,0

Assim, a variância populacional é de aproximadamente 8,9, e o desvio padrão

populacional é de aproximadamente 3,0 ou US$ 3.000.

Exemplo 5.2:

Encontre a variância e o desvio padrão populacionais dos salários iniciais para a

empresa B no Exemplo 4.1.

a) Calcule a média e cada desvio.

b) Faça o quadrado de cada desvio e some para obter a soma dos quadrados.

c) Divida por N para obter a variância populacional.

d) Calcule a raiz quadrada da variância populacional para obter o desvio padrão

populacional.

e) Interprete os resultados fornecendo o desvio padrão populacional em dólares.

Page 26: Estatística e Probabilidade Estatística Descritiva www ... · Estatística e Probabilidade Estatística Descritiva (Teoria) – Rev2 1 1. Introdução às distribuições normais

Estatística e Probabilidade

Estatística Descritiva (Teoria) – Rev2

www.portaleletronica.com.br

26

Solução:

Salário

x

Desvio

(𝑥 − 𝜇)

Desvio

(𝑥 − 𝜇)2

𝚺𝐱 = 𝑺𝑺𝑿 =

As fórmulas exibidas no quadro Definição a seguir para a variância amostral s2 e o

desvio padrão amostral s diferem ligeiramente daquelas para a população. Por

exemplo, para encontrar s, a fórmula usa x. Além disso, SSx é dividido por n – 1. Por

que dividir por uma unidade a menos do total de elementos? Em muitos casos, uma

estatística é calculada para estimar o parâmetro correspondente, tal como usar x para

estimar m. A teoria estatística tem mostrado que as melhores estimativas de s2 e s

são obtidas ao dividir SSx por n – 1 nas fórmulas para s2 e s.

Page 27: Estatística e Probabilidade Estatística Descritiva www ... · Estatística e Probabilidade Estatística Descritiva (Teoria) – Rev2 1 1. Introdução às distribuições normais

Estatística e Probabilidade

Estatística Descritiva (Teoria) – Rev2

www.portaleletronica.com.br

27

A Tabela abaixo resume os símbolos usuais e indicações operacionais relativas a

variância e desvio padrão.

Exemplo 5.3:

Encontrando a variância e o desvio padrão amostral.

Em um estudo com jogadores de futebol americano do ensino médio que sofreram

lesões, os pesquisadores colocaram os jogadores em dois grupos. Jogadores que se

recuperaram das concussões em 14 dias ou menos foram colocados no grupo 1.

Aqueles que levaram mais de 14 dias foram para o grupo 2. Os tempos de

Page 28: Estatística e Probabilidade Estatística Descritiva www ... · Estatística e Probabilidade Estatística Descritiva (Teoria) – Rev2 1 1. Introdução às distribuições normais

Estatística e Probabilidade

Estatística Descritiva (Teoria) – Rev2

www.portaleletronica.com.br

28

recuperação (em dias) para o grupo 1 estão listados a seguir. Encontre a variância e

o desvio padrão amostrais dos tempos de recuperação.

(Adaptado de: The American Journal of Sports Medicine.)

4 7 6 7 9 5 8 10 9 8 7 10

Solução

Para esse conjunto de dados, n = 12 e Σx = 90. A média é �̅� = 90/12 = 7,5. Para

calcular 𝑠2 e s, note que n – 1 = 12 – 1 = 11.

Logo, a variância amostral é, aproximadamente, 3,5 e o desvio padrão amostral é,

aproximadamente, 1,9 dia.

Page 29: Estatística e Probabilidade Estatística Descritiva www ... · Estatística e Probabilidade Estatística Descritiva (Teoria) – Rev2 1 1. Introdução às distribuições normais

Estatística e Probabilidade

Estatística Descritiva (Teoria) – Rev2

www.portaleletronica.com.br

29

Exemplo 5.4:

Veja o estudo do Exemplo 5.3. Os tempos de recuperação (em dias) para o grupo 2

estão listados a seguir. Encontre a variância e o desvio padrão amostrais dos tempos

de recuperação.

43 57 18 45 47 33 49 24

a) Calcule a soma dos quadrados.

b) Divida por n – 1 para obter a variância amostral.

c) Calcule a raiz quadrada da variância amostral para obter o desvio padrão

amostral.