21
Estatística: Revelando o poder dos dados Lock 5 Seção 2.2 Uma Variável Quantitativa: Forma e Centro

Uma Variável Quantitativa: Forma e Centromrubens/cursos/EstatAplicCom/Capitulo2-2.pdf · Estatística: Revelando o poder dos dados Lock5 Uma Variável Quantitativa Receitas Mundiais

  • Upload
    others

  • View
    11

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Uma Variável Quantitativa: Forma e Centromrubens/cursos/EstatAplicCom/Capitulo2-2.pdf · Estatística: Revelando o poder dos dados Lock5 Uma Variável Quantitativa Receitas Mundiais

Estatística: Revelando o poder dos dados Lock5

Seção 2.2

Uma Variável Quantitativa:

Forma e Centro

Page 2: Uma Variável Quantitativa: Forma e Centromrubens/cursos/EstatAplicCom/Capitulo2-2.pdf · Estatística: Revelando o poder dos dados Lock5 Uma Variável Quantitativa Receitas Mundiais

Estatística: Revelando o poder dos dados Lock5

Sumário

Uma Variável Quantitativa

Visualização: gráfico de pontos e histograma

Forma: simétrica, assimétrica

Medidas do centro: média e mediana

Outliers e robustez

Page 3: Uma Variável Quantitativa: Forma e Centromrubens/cursos/EstatAplicCom/Capitulo2-2.pdf · Estatística: Revelando o poder dos dados Lock5 Uma Variável Quantitativa Receitas Mundiais

Estatística: Revelando o poder dos dados Lock5

Uma Variável Quantitativa

Receitas Mundiais dos Filmes de Hollywood em 2011

FilmesHollywood2011

Mais gráficos sobre lucrosdos filmes de Hollywood

Page 4: Uma Variável Quantitativa: Forma e Centromrubens/cursos/EstatAplicCom/Capitulo2-2.pdf · Estatística: Revelando o poder dos dados Lock5 Uma Variável Quantitativa Receitas Mundiais

Estatística: Revelando o poder dos dados Lock5

FilmesHollywood2011.xls

Page 5: Uma Variável Quantitativa: Forma e Centromrubens/cursos/EstatAplicCom/Capitulo2-2.pdf · Estatística: Revelando o poder dos dados Lock5 Uma Variável Quantitativa Receitas Mundiais

Estatística: Revelando o poder dos dados Lock5

Gráfico de Pontos

Em um gráfico de pontos, cada caso é representado por um ponto e os pontos são empilhados.

Maneira fácil de ver cada caso

attach(Filmes)Dotplot(ReceitaMundial, bin=TRUE, breaks=50)

Page 6: Uma Variável Quantitativa: Forma e Centromrubens/cursos/EstatAplicCom/Capitulo2-2.pdf · Estatística: Revelando o poder dos dados Lock5 Uma Variável Quantitativa Receitas Mundiais

Estatística: Revelando o poder dos dados Lock5

Histograma

A altura de cada barra corresponde ao número de casos dentro desse intervalo da variável

Page 7: Uma Variável Quantitativa: Forma e Centromrubens/cursos/EstatAplicCom/Capitulo2-2.pdf · Estatística: Revelando o poder dos dados Lock5 Uma Variável Quantitativa Receitas Mundiais

Estatística: Revelando o poder dos dados Lock5

Histograma vs Gráfico de Barras Um gráfico de barras é para dados categóricos e o eixo

x não possui escala numérica

Um histograma é para dados quantitativos e o eixo x é

numérico

Para uma variável categórica, o número de barras é

igual ao número de categorias e o número em cada

categoria é fixo

Para uma variável quantitativa, o número de barras em

um histograma depende de você (ou de seu software), e a

aparência pode diferir com diferentes números de barras

Page 8: Uma Variável Quantitativa: Forma e Centromrubens/cursos/EstatAplicCom/Capitulo2-2.pdf · Estatística: Revelando o poder dos dados Lock5 Uma Variável Quantitativa Receitas Mundiais

Estatística: Revelando o poder dos dados Lock5

Forma

Simétrica Assimatria à esquerdaAssimetria à direita

Cauda longa à direita

Page 9: Uma Variável Quantitativa: Forma e Centromrubens/cursos/EstatAplicCom/Capitulo2-2.pdf · Estatística: Revelando o poder dos dados Lock5 Uma Variável Quantitativa Receitas Mundiais

Estatística: Revelando o poder dos dados Lock5

Forma de Sino (simétrica)F

requency

-15 -10 -5 0 5 10 15

050

150

Fre

quency

-15 -10 -5 0 5 10 15

050

150

Page 10: Uma Variável Quantitativa: Forma e Centromrubens/cursos/EstatAplicCom/Capitulo2-2.pdf · Estatística: Revelando o poder dos dados Lock5 Uma Variável Quantitativa Receitas Mundiais

Estatística: Revelando o poder dos dados Lock5

Notação O tamanho da amostra, o número de casos na amostra, é denotado por n

Geralmente assumimos que x ou y representamqualquer variável, e x1 , x2 , …, xn representam os n valoresda variável x (no exemplo abaixo x representa ReceitaMundial)

x1 = 97,009, x2 = 201,897, …, x134 = NA, x135 = 30,147 , x136 = NA

Page 11: Uma Variável Quantitativa: Forma e Centromrubens/cursos/EstatAplicCom/Capitulo2-2.pdf · Estatística: Revelando o poder dos dados Lock5 Uma Variável Quantitativa Receitas Mundiais

Estatística: Revelando o poder dos dados Lock5

Média

A média ou média dos valores de dados é

𝑚é𝑑𝑖𝑎 =𝑠𝑜𝑚𝑎 𝑑𝑒 𝑡𝑜𝑑𝑜𝑠 𝑜𝑠 𝑣𝑎𝑙𝑜𝑟𝑒𝑠 𝑑𝑒 𝑑𝑎𝑑𝑜𝑠

𝑄𝑢𝑎𝑛𝑡𝑖𝑑𝑎𝑑𝑒 𝑑𝑒 𝑣𝑎𝑙𝑜𝑟𝑒𝑠 𝑑𝑒 𝑑𝑎𝑑𝑜𝑠

Média amostral: ҧ𝑥 (lê-se “x barra”) Média populacional: (letra grega “mi”)

𝑚é𝑑𝑖𝑎 =𝑥1 + 𝑥2 +⋯+ 𝑥𝑛

𝑛=σ𝑥

𝑛

R: mean(x)

Page 12: Uma Variável Quantitativa: Forma e Centromrubens/cursos/EstatAplicCom/Capitulo2-2.pdf · Estatística: Revelando o poder dos dados Lock5 Uma Variável Quantitativa Receitas Mundiais

Estatística: Revelando o poder dos dados Lock5

Mediana

A mediana, m, é o valor do meio quando os dados estão ordenados.

Se houver um número par de valores, a mediana é a média dos dois valores

intermediários.

A mediana divide os dados ao meio.

Page 13: Uma Variável Quantitativa: Forma e Centromrubens/cursos/EstatAplicCom/Capitulo2-2.pdf · Estatística: Revelando o poder dos dados Lock5 Uma Variável Quantitativa Receitas Mundiais

Estatística: Revelando o poder dos dados Lock5

Medidas do Centro

Para cada uma das seguintes variáveis: Encontre a média Encontre a mediana Identifique quaisquer outliers

1. 8, 12, 3, 18, 15

2. 41, 53, 38, 12, 115, 47, 50

3. 15, 22, 12, 28, 58, 18, 25, 18

4. 110, 112, 118, 119, 122, 125, 129, 135, 138, 140

Page 14: Uma Variável Quantitativa: Forma e Centromrubens/cursos/EstatAplicCom/Capitulo2-2.pdf · Estatística: Revelando o poder dos dados Lock5 Uma Variável Quantitativa Receitas Mundiais

Estatística: Revelando o poder dos dados Lock5

m = 76,66

=150,74A média é "puxada" na direção da assimetria

Medidas do Centro

Page 15: Uma Variável Quantitativa: Forma e Centromrubens/cursos/EstatAplicCom/Capitulo2-2.pdf · Estatística: Revelando o poder dos dados Lock5 Uma Variável Quantitativa Receitas Mundiais

Estatística: Revelando o poder dos dados Lock5

Assimetria e Centro

Uma distribuição é assimétrica à esquerda. Qual medida do centro você esperaria ser maior?

Mediana. Neste caso a média será puxada para baixo em direção à assimetria (em direção à cauda mais longa).

Page 16: Uma Variável Quantitativa: Forma e Centromrubens/cursos/EstatAplicCom/Capitulo2-2.pdf · Estatística: Revelando o poder dos dados Lock5 Uma Variável Quantitativa Receitas Mundiais

Estatística: Revelando o poder dos dados Lock5

Assimetria e Centro

Média e mediana para diferentes formas de distribuição

Page 17: Uma Variável Quantitativa: Forma e Centromrubens/cursos/EstatAplicCom/Capitulo2-2.pdf · Estatística: Revelando o poder dos dados Lock5 Uma Variável Quantitativa Receitas Mundiais

Estatística: Revelando o poder dos dados Lock5

Outlier

Um outlier é um valor observado que é notavelmente distinto dos outros valores em um conjunto de dados.

Page 18: Uma Variável Quantitativa: Forma e Centromrubens/cursos/EstatAplicCom/Capitulo2-2.pdf · Estatística: Revelando o poder dos dados Lock5 Uma Variável Quantitativa Receitas Mundiais

Estatística: Revelando o poder dos dados Lock5

Outliers

Harry Potter

TransformersPirates of the Caribbean

Page 19: Uma Variável Quantitativa: Forma e Centromrubens/cursos/EstatAplicCom/Capitulo2-2.pdf · Estatística: Revelando o poder dos dados Lock5 Uma Variável Quantitativa Receitas Mundiais

Estatística: Revelando o poder dos dados Lock5

Robustez (traduzida como resistência)

Uma estatística é robusta se ela não for relativamente afetada por valores

extremos.

A mediana é robusta, enquanto a média não é.

Média Mediana

Com Harry Potter $150.742.300 $76.658.500

Sem Harry Potter $141.889.900 $75.009.000

Page 20: Uma Variável Quantitativa: Forma e Centromrubens/cursos/EstatAplicCom/Capitulo2-2.pdf · Estatística: Revelando o poder dos dados Lock5 Uma Variável Quantitativa Receitas Mundiais

Estatística: Revelando o poder dos dados Lock5

Outliers

Ao usar estatísticas que não são resistentes a valores discrepantes, pare e pense se o outlier é um erro

Se não, você tem que decidir se o outlier é parte de sua população de interesse ou não

Geralmente, para outliers que não são um erro, é melhor executar a análise duas vezes, uma vez com os outliers e uma vez sem, para ver o quanto os outliers estão afetando os resultados

Page 21: Uma Variável Quantitativa: Forma e Centromrubens/cursos/EstatAplicCom/Capitulo2-2.pdf · Estatística: Revelando o poder dos dados Lock5 Uma Variável Quantitativa Receitas Mundiais

Estatística: Revelando o poder dos dados Lock5

Resumo

Visualizando uma variável quantitativa:Gráfico de pontosHistograma

Forma: SimétricaAssimétrica

Medidas do centro:Média (resistente a outliers)Mediana (resistente a outliers)