Upload
others
View
1
Download
0
Embed Size (px)
Citation preview
11
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
Coleção de números = estatísticasColeção de números = estatísticas
� O número de carros vendidos no país
aumentou em 30%.
� A taxa de desemprego atinge, este mês,
7,5%.
� As ações da Telebrás subiram R$ 1,5, hoje.
� Resultados do Carnaval no trânsito: 145
mortos, 2430 feridos.
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
Estatística: Estatística: uma definição
A ciência de coletar, organizar,
apresentar, analisar e interpretar dados
com o objetivo de tomar melhores
decisões.
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
Estatística (divisão)
Descritiva
Indutiva
Os procedimentos usadospara organizar, resumir eapresentar dados.
A coleção de métodos etécnicas utilizados para estudaruma população baseado emamostras probabilísticas destapopulação.
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
População
Uma coleção de todos os
possíveis elementos, objetos ou
medidas de interesse.
22
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
Censo
Um levantamento efetuado sobre
toda uma população é denominado de
levantamento censitário ou
simplesmente censo.
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
Amostra
Uma porção ou parte de
uma população de interesse.
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
Amostragem
O processo de escolha de uma
amostra da população é denominado
de amostragem.
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
PROBABILIDADE(Matemática) Univariada
ESTATÍSTICA(Matemática
Aplicada)Multivariada
Trabalha com uma
única característica
dos dados
Trabalha com duas ou
mais características
dos dados
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
POPULAÇÃO(Censo)
AMOSTRA(Amostragem)
InferênciaErro
PROBABILIDADE
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
Estatística Descritiva
Probabilidade
Estatística Indutiva
Amostragem
33
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
Estatística x Probabilidade
Faces Probabilidades Faces Freqüências
1 1/6 1 15
2 1/6 2 18
3 1/6 3 23
4 1/6 4 25
5 1/6 5 22
6 1/6 6 17
Total 1 Total 120
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
Arredondamento
Todo arredondamento é um erro.
O erro deve ser evitado ou então
minimizado.
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
Regra básica:
Arrendondar sempre para o mais
próximo.
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
É ímpar
É par
Aumenta
Não aumenta
Exemplos:
1,456 1,46 1,454 1,45
1,475 1,48
1,485 1,48
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
V
A
R
I
Á
V
E
I
S
QualitativasQualitativas
Quantitativas
OrdinalOrdinal
NominalNominal
DiscretaDiscreta
ContínuaContínua
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
NOMINAL
ORDINAL
SexoReligião
Estado civil Curso
Conceito
Grau de Instrução
Mês
Dia da semana
Variável Qualitativa
44
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
Variável Quantitativa
Número de faltas
Número de irmãos
Número de acertos
Altura
Área
Peso
Volume
CONTÍNUA
DISCRETA
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
Estatística Descritiva
Organização;
Resumo;
Apresentação.
Conjunto de dados:
�Amostra
ou
�População
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
Um conjunto de dados éresumido de acordo com as seguintescaracterísticas:
Tendência ou posição central
Dispersão ou variabilidade
Assimetria (distorção)
Achatamento ou curtose
Amostra ouPopulação
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
Tendência ou Posição Central
(a) As médias
Simples
Aritmética
Geométrica
Harmônica
Quadrática
Interna
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
A média Aritmética
n
xx
n
1
n
x...xxx i
in21 ∑
=∑=+++
=
55
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
A média Geométrica
ni
nn21g xx ... .x.xm ∏==
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
A média Harmônica
∑=
+++
=
=
+++
=
x
1n
x
1...
x
1
x
1n
nx
1...
x
1
x
11
m
in21
n21
h
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
A média Quadrática
n
x
n
x...xxm
2i
2n
22
21
q∑
=++
=
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
A média InternaA média Interna
É a mesma média aritmética só
que aplicada sobre o conjunto onde
uma parte dos dados (extremos) é
descartada.
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
Conjuntos mgmh
4 6 5 4,9 4,8
1 9 5 3 1,8
x
Médias
Exemplo
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
Relação entre as médias
Dado um conjunto de dados
qualquer, as médias aritmética,
geométrica e harmônica mantém a
seguinte relação:
mmx hg ≥≥
66
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
Tendência ou Posição Central
(a) As médias
Ponderadas
Aritmética
Geométrica
Harmônica
Quadrática
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
A média Aritmética Ponderada
∑
∑=
=+++
+++=
w
w.x
w...ww
w.x...w.xw.xm
i
ii
k21
kk2211ap
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
A média Geométrica Ponderada
∑
∑
∏=
==
w wi
w wk
w2
w1gp
i i
i k21
x
x ... .x.xm
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
A média Harmônica Ponderada
∑
∑=
=
+++
++=
x
ww
x
w...
x
w
x
wwww
m
i
i
i
k
k
2
2
1
1
k21h P
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
Produtos p01 p02 q
Carne 4,80 5,52 5
Cana 5,20 4,94 1
Ceva 0,80 0,92 12Pão 1,50 2,10 2
Total -- --
Exemplo
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
Produto p01 p02 α p(0,t)
1 4,80 5,52 0,57 1,15
2 5,20 4,94 0,13 0,95
3 0,80 0,92 0,23 1,15
4 1,50 2,10 0,07 1,40
Total -- -- 1,00 --
77
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
Solução
114,15%1,1415
07,023,013,057,0
07,0.40,123,0.15,113,0.95,057,0.15,1map
==
=+++
+++=
Média aritmética ponderada dos
relativos (aumentos) será:
Por este critério o aumento foi de
14,15%.Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
Média geométrica ponderada dos
relativos (aumentos) será:
Por este critério o aumento foi de
13,73%.
%73,1131373,1
40,115,195,015,1
40,115,195,015,1m07,023,013,057,0
1 07,023,013,057,0gp
==
==
==
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
Média harmônica ponderada dos
relativos (aumentos) será:
Por este critério o aumento foi de
13,32%.
%32,1131332,1
40,1
07,0
15,1
23,0
95,0
13,0
15,1
57,01
m h P
==
=
+++
=
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
Tendência ou Posição Central
(b) A mediana (median)
me = [x(n/2) + x(n/2)+1]/2 se “n” é par
É o valor que separa o conjunto emdois subconjuntos do mesmo tamanho.
me = x(n+1)/2 se “n” é ímpar
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
Tendência ou Posição Central
(b) Separatrizes
A idéia de repartir o conjunto de dados
pode ser levada adiante. Se ele for repartido
em 4 partes tem-se os QUARTIS, se em 10 os
DECIS e se em 100 os PERCENTIS.
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
Considere o seguinte conjunto:
1 -1 0 4 2 5 3
Como n = 7 (ímpar), então x(n+1)/2 = x4
Ordenando o conjunto, tem-se:
-1 0 1 2 4 3 5
Então: me = x4 = 2
Exemplo
88
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
Se o conjunto for:
1 -1 0 4 2 5 3 -2Tem-se: n = 8 (par)
Então me = [xn/2+xn/2+1)]/2 = (x4 + x5)/2
Ordenando o conjunto, tem-se:
-2 -1 0 1 2 3 4 5
me = (x4 + x5)/2 = (1 + 2)/2 = 1,50Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
Tendência ou Posição Central
(c) A moda (mode)
É o(s) valor(es) do conjunto que
mais se repete(m).
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
Considere o conjunto
0 1 1 2 2 2 3 5
Então: mo = 2
Pois, o dois é o que mais se repete
(três vezes).
Exemplo 1
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
Considere o conjunto:
0 1 1 2 2 3 5
Então: mo = 1 e mo = 2
Conjunto bimodal
Exemplo 2
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
Considere o conjunto:
0 1 2 3 4 5 7
Este conjunto é amodal, pois
todos os valores apresentam a mesma
freqüência.
Exemplo 3
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
(a) A amplitude (h)
(b) O Desvio Médio (dma)
(c) A Variância (s2)
(d) O Desvio Padrão (s)
(e) A Variância Relativa (g2)
(f) O Coeficiente de Variação (s)
Dispersão ou VariabilidadeDispersão ou Variabilidade
99
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
h = xmáx - xmín
A Amplitude (range)
Considere o conjunto:
-2 -1 0 3 5
h = 5 – (-2) = 7
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
A média é:
15
5
5
53021x ==
+++−−=
O dma (average deviation)
Considere o conjunto:
-2 -1 0 3 5
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
Calculando os desvios: xxi −
Tem-se: d1 = -2 – 1 = -3
d2 = -1 – 1 = -2
d3 = 0 – 1 = -1
d4 = 3 – 1 = 2
d5 = 5 – 1 = 4Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
Como pode ser visto a soma éigual a zero. Tomando o módulo vem:
40,25
125
|4||2||1||2||3|n
|xx|dma i
==
=++++−+−+−
=
=∑ −
=
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
Se ao invés de tomar o módulo,elevarmos ao quadrado, tem-se:
80,65
34
5
1641495
42)1()2()3(
n
)xx(s
22222
i2
2
==++++
=
=++−+−+−
=
=∑ −
=
A variância (variance)
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
n
)xx(
n
)xx(....)xx()xx(s
i2
n2
22
12
2
∑ −=
=−++−+−
=
A variância de um conjunto dedados será:
xn
xs 2
2i2 −
∑=
1010
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
É a raiz quadrada da variância
xn
x
n
)xx(s 2
2ii
2
−∑
=∑ −
=
O Desvio Padrão (standard deviation)
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
Se extrairmos a raiz quadradateremos do resultado anteriorteremos:
61,280,6n
)xx(s i
2
==∑ −
=
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
A Variância Relativa
O Coeficiente de Variação
x
sg2
22
=
x
sg =
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
O coeficiente de variação do
exemplo anterior, será:
%77,2601
6077,2
x
sg ===
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
Organização;
Resumo;
Apresentação. Amostra
ou População
Grande Conjuntos de DadosGrande Conjuntos de Dados
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
1111
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
Ótimo Muito BomMuito Bom BomBom InsuficienteRegular ÓtimoInsuficiente BomMuito Bom Muito BomÓtimo RegularRegular BomBom Muito BomMuito Bom Insuficiente................... ....................
Conceitos da Escola Athira Karabina
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
Defeito Freqüência %Ótimo 71 14,20
Muito Bom 95 19,00
Bom 97 19,40
Regular 70 14,00
Insuficiente 83 16,60
TOTAL 500 100
Distribuição de freqüênciasDistribuição de freqüências
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
SIMPLES
ACUMULADAS
Absoluta
Relativa
Absoluta
Relativa
Apresentação
FREQÜÊNCIAS Percentual
Apresentação
Percentual
Decimal
Decimal
1212
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
Valores fi Fi fri fri Fri
0 60 60 0,30 30 30
1 50 110 0,25 25 55
2 40 150 0,20 20 75
3 30 180 0,15 15 90
4 10 190 0,05 5 95
5 6 196 0,03 3 98
6 4 200 0,02 2 100
TOTAL 200 — 1,00 100 —
Freqüências: representação
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
Defeitos em uma linha de produção
14%
20%
19%14%
17%
11%5%
Desenho
Esmalte
Lascado
Maior
Menor
Torto
Trincado
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
Número de irmãos dos alunos da turma
450 - Estatística - PUCRS - 2012/01
0 1 1 6 3 1 3 1 1 0
4 5 1 1 1 0 2 2 4 1
3 1 2 1 1 1 1 5 5 6
4 1 1 0 2 1 4 3 2 2
1 0 2 1 1 2 3 0 1 0
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
1313
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
Distribuição de freqüências por
ponto ou valores da variável:
“NúmeroNúmero dede irmãosirmãos dosdos alunosalunos dada
turmaturma 450450” da disciplina:
Probabilidade e Estatística PUCRS -
2012/01.
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
N0 de irmãos N0 de alunos0 71 212 83 54 45 36 2∑ 50
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
Diagrama de colunas simples da
variável: Número de irmãos dos
alunos da turma 450 Disciplina:
Estatística, PUCRS - 2012/01
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
0
5
10
15
20
25
0 1 2 3 4 5 6
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
1414
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
Neste caso, a média a dada por:
nx.f
f...ff
x.f...x.fxfx ii
k21
kk2211 ∑=
+++
+++=
A média AritméticaA média Aritmética
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
xi fi fixi0 7 01 21 212 8 163 5 154 4 165 3 156 2 12∑ 50 95
ExemploExemplo
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
A média será, então:
irmãos 90,150
95
nx.f x ii ==
∑=
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
Como n = 50 é par, tem-se:
irmão
2 me
xx
xxxx )/(/)/n(/n
1211
2
2
2625
1250250122
=+
=+
=
=+
=+
=++
A MedianaA Mediana
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
Total de Total de dados dados n = 50 n = 50 (par)(par)
xi fi Fi0 7 71 21 282 8 363 5 414 4 455 3 486 2 50∑∑∑∑ 50 —
Metade Metade dos dados dos dados n/2 = 25n/2 = 25
ExemploExemplo
1515
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
mo = valor(es) que mais se
repete(m)
A ModaA Moda
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
xi fi0 71 212 83 54 45 36 2∑ 50
A moda é A moda é igual aigual a1 (um)1 (um)
Pois ele se Pois ele se repete repete
mais vezesmais vezes
ExemploExemplo
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
h = xmáx - xmín
h = 6 - 0 = 6 irmãos
A AmplitudeA Amplitude
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
Neste caso, o dma será dado por:
n
|xx|.f
f...ff
|xx|f...|xx|f|xx|fdma
ii
k21
k21 k21
−∑=
=+++
−++−+−=
O Desvio Médio O Desvio Médio
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
xi fi fi|xi - | 0 7 7.|0 – 1,90| = 13,301 21 21.|1 – 1,90| = 18,90 2 8 8.|2 – 1,90| = 0,803 5 5.|3 – 1,90| = 5,504 4 4.|4 – 1,90| = 8,405 3 3.|5 – 1,90| = 9,30 6 2 2.|6 – 1,90| = 8,20∑∑∑∑ 50 64,40
x
ExemploExemplo
1616
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
O dma será, então:
irmãos 29,150
40,64
n
|xx|.f dma ii==
−∑=
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
xn
xfn
)xx(f
n
)xx(f....)xx(f)xx(fs
22ii
2i
2k
22
2
2
i
k211
−∑
=∑ −
=
=−++−+−
=
Neste caso, a variância será:
A Variância A Variância
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
xi fi fixi2
0 7 02.7 = 01 21 12.21 = 212 8 22.8 = 323 5 32.5 = 454 4 42.4 = 645 3 52.3 = 756 2 62.2 = 72∑∑∑∑ 50 299
ExemploExemplo
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
A variância será, então:
irmãos 3700,2
90,150
299 x
n
xfs
2
22
2
i2 i
=
=−=−∑
=
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
O desvio padrão será dado por:
irmãos 1,54 1,5395
3700,2xn
xfs 22ii
≅=
==−∑
=
O Desvio Padrão O Desvio Padrão
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
Dividindo a média pelo desviopadrão, tem-se o coeficiente de variação:
%03,8190,1
539480,1g ==
O Coeficiente de Variação
1717
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
Idade (em meses) dos
alunos da turma 450 da
disciplina: Probabilidade e
Estatística - PUCRS - 2012/01
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
276 245 345 240 270 310 368
334 268 288 336 299 236 239 355 330
287 344 300 244 303 248 251 265 246
240 320 308 299 312 324 289 320 264
252 298 315 255 274 264 263 230 303
369 247 266 275 281 230 234
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
Distribuição por classes ou
intervalos da variável “idade dos alunos
da turma 450” da disciplina:
Probabilidade e Estatística da PUCRS -
2012/01
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
Idades Número de alunos230 |--- 250 12250 |--- 270 9270 |--- 290 8290 |--- 310 7310 |--- 330 6330 |--- 350 5350 |--- 370 3
Total 50
1818
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
Histograma de freqüências da
variável “Idade dos alunos da turma
450” de Probabilidade e Estatística
da PUCRS - 2012/01
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
0
0,1
0,2
0,3
0,4
0,5
0,6
0,7
2 3 0 | - - - 2 50 2 50 |- - - 2 70 2 70 |- - - 2 9 0 2 9 0 |- - - 3 10 3 10 |- - - 3 3 0 3 3 0 |- - - 3 50 3 50 | - - - 3 70
fi / hi
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
Antes de apresentar as medidas,
i. é, representantes do conjunto, é
necessário estabelecer uma notação
para alguns elementos da
distribuição.
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
1919
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
xi = ponto médio da classe;
fi = freqüência simples da classe;
lii = limite inferior da classe;
lsi = limite superior da classe;
hi = amplitude da classe.
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
xi fi xi
230 |--- 250 12 240250 |--- 270 9 260270 |--- 290 8 280290 |--- 310 7 300310 |--- 330 6 320330 |--- 350 5 340350 |--- 370 3 360
∑ 50 —
O Ponto Médio da Classe O Ponto Médio da Classe
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
xi fi fi. xi
240 12 2880260 9 2340280 8 2240300 7 2100320 6 1920340 5 1700360 3 1080∑ 50 14260
A Média da Distribuição
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
A média será:
meses 20,28550
14260
nx.f x ii
==∑
=
ExemploExemplo
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
Neste caso, utilizam-se as
freqüências acumuladas para
identificar a classe mediana, i. é, a
que contém o(s) valor(es)
central(is).
A Mediana A Mediana
2020
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
Total de Total de dados dados n = 50 n = 50 (par)(par)
Metade Metade dos dados dos dados n/2 = 25n/2 = 25
xi fi Fi230 |--- 250 12 12250 |--- 270 9 21270 |--- 290 8 29290 |--- 310 7 36310 |--- 330 6 42330 |--- 350 5 47350 |--- 370 3 50
∑∑∑∑ 50 —
ExemploExemplo
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
Portanto, a classe mediana
é a terceira. Assim i = 3. A
mediana será obtida através da
seguinte expressão:
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
meses 2808
420 270
8
212
50
20702
8
212
50
20702 f
F2
n
hli mi
1i
iie
=+=
−
+=
=
−
+=
−
+=−
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
Neste caso é preciso
inicialmente apontar a classe
modal, i. é, a de maior freqüência.
Neste exemplo é a primeira com fi
= 12. Assim i = 1.
A Moda A Moda
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
Classe Classe modal, pois modal, pois
ffii = 12. = 12.
i xi fi1 230 |--- 250 122 250 |--- 270 93 270 |--- 290 84 290 |--- 310 75 310 |--- 330 66 330 |--- 350 57 350 |--- 370 3— ∑∑∑∑ 50
ExemploExemplo
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
Portanto a moda poderá
ser obtida através de uma
das seguintes expressões:
2121
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
Critério de King:
meses 250 9
9.20023
90
9.20302
ff
fhli m
1i 1i
1iiio
=
+=
=
++=
++=
− +
+
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
Critério de Czuber:
meses 246 16230
924
12.20023
)90(12.2
012.20302
)ff(f.2
ffhli m
1ii
i
1i
1iiio
=+=
=
−+=
=
+−
−+=
=
+−
−+=
− +
−
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
h = xmáx - xmín
h = 370 - 230 = 140 meses
A Amplitude A Amplitude
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
Neste caso, o dma será dado por:
n
|xx|.f
f...ff
|xx|f...|xx|f|xx|fdma
ii
k21
k21 k21
−∑=
=+++
−++−+−=
O Desvio Médio Absoluto O Desvio Médio Absoluto
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
xxi fi fi.|xi - | 240 12 12.|240 – 285,20| = 542,40260 9 9.|260 – 285,20| = 226,80 280 8 8.|280 – 285,20| = 41,60300 7 7.|300 – 285,20| = 103,60320 6 6.|320 – 285,20| = 208,80340 5 5.|340 – 285,20| = 274,00360 3 3.|360 – 285,20| = 224,40∑ 50 1621,60
ExemploExemplo
2222
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
O dma será, então:
meses 32,43
50
60,1621
n
|xx|.f dma ii
=
==−∑
=
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
xn
xfn
)xx(f
n
)xx(f....)xx(f)xx(fs
22ii
2i
2k
22
2
2
i
k211
−∑
=∑ −
=
=−++−+−
=
Neste caso, a variância será:
A Variância A Variância
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
xi fi fi. xi2
240 12 12.2402 = 691200 260 9 9.2462 = 608400280 8 8.2802 = 627200300 7 7.3002 = 630000320 6 6.3202 = 614400340 5 5.3402 = 578000360 3 3.3602 = 388800∑ 50 4 138 000
ExemploExemplo
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
A variância será, então:
meses 420,961
20,28550
4138000
xn
xfs
2
2
2
2
i2 i
=
=−=
=−∑
=
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
O desvio padrão será dado por:
meses 37,70 37,6956
96,1420xn
xfs 22ii
≅=
==−∑
=
O Desvio Padrão O Desvio Padrão
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
Dividindo a média pelo desvio
padrão, tem-se o coeficiente de
variação:
%22,1320,285
695623,37g ==
O Coeficiente de Variação
2323
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
SkewnessProf. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
Primeiro Coeficiente ( de Pearson)
a1 = (Média - Moda) / Desvio Padrão
Segundo Coeficiente ( de Pearson)
a2 = 3.(Média - Mediana) / Desvio Padrão
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
Coeficiente Quartílico
CQA =[(Q3 - Q2) - (Q2 - Q1)]/(Q3 - Q1)
Coeficiente do Momento
a3 = m3/s3, onde m3 = Σ(Σ(Σ(Σ(X - )3/nx
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
Coeficiente = 0Conjunto Simétrico
Provão 2000Curso: Odonto
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
Coeficiente < 0Conjunto: Negativamente Assimétrico
Provão 2000Curso: Jornalismo
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
Coeficiente > 0Conjunto: Positivamente Assimétrico
Provão 2000Curso: Eng. Elétrica
2424
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
(Kurtosis)
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
Coeficiente de Curtose (momentos)
xa4 = m4/s4, onde m4 = Σ(X - )4/n
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
Coeficiente = 3 ou 0Conjunto: Mesocúrtico
Provão 2000Curso: Odonto
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
Coeficiente > 3 ou (> 0)Conjunto: Leptocúrtico
Provão 2000Curso: Matemática
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
Coeficiente < 3 ou (< 0)Conjunto: Platicúrtico
Provão 1999Curso: Eng. Civil
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
2525
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
Então:
Se y = ax +by = ax +b
b+xa=y
sa=s 2x
22y
s|a|=s xy
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
Análise Exploratória de Dados
As técnicas de análise exploratória dedados consistem em gráficos simples dedesenhar que podem ser utilizados pararesumir rapidamente um conjunto de dados.Uma destas técnicas é uma forma deapresentação de dados conhecida comoCaule e Folha.
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
Apresentação Caule e Folha
Para ilustrar esta forma deapresentação vamos supor que oconjunto a seguir é o resultado de umteste do tipo Psicotécnico de 100questões aplicados a 40 candidatos aum emprego em uma grandeorganização industrial.
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
44 53 67 89 98 37 60 55
48 88 47 65 82 85 90 74
41 61 72 73 77 81 60 89
52 90 62 64 66 59 50 65
50 40 93 79 55 49 56 73
Resultado de um teste do tipoPsicotécnico de 100 questões aplicados a 40candidatos.
Exemplo
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
3 7
4 0 1 4 7 8 9 9
5 0 0 2 3 5 5 6 9
6 0 0 1 2 4 5 5 6 7
7 2 3 3 3 4 7 9
8 1 2 5 5 8 8 9
9 0 0 3 8
Ramo e Folha
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
Girando a representação 90 graustem-se um diagrama semelhante a umhistograma. Esta representação possuiduas vantagens sobre o histograma:
É mais fácil de construir;
Apresenta os dados reais.
2626
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
1565 1790 1644 1679 2008
1675 1900 1832 1756 1766
1580 1945 1733 1922 1854
1975 1870 1812 1954 1888
1634 1785 1855 2044 1965
Faça um representação utilizando adezena como unidade de folha.
Exercício
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
BoxPlot – Caixa e Bigode
Outra forma de ter uma idéia doconjunto de dados é utilizar a regra doscinco itens. Nem sempre a média e odesvio padrão são as melhoresalternativas para resumir um conjuntode dados.
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
A média e o desvio padrão podem
sofrer forte influência de valores
extremos e além disso não fornecem uma
idéia da assimetria do conjunto de dados.
Como alternativa as seguintes cinco
medidas são sugeridas (Tukey, 1977):
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
(i) A mediana;
(ii) Os extremos (máximo e mínimo);
(iii) Os quartis.
Estas cinco medidas são denominadas
de estatísticas de ordem.
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
Representação
A informação fornecida por estes
cinco números pode ser representada em
um diagrama denominado de “Diagrama
Caixa e Bigode” (BoxPlot). O desenho
fornece uma idéia da posição, dispersão,
assimetria e dados discrepantes do
conjunto (outliers).Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
Traçar um retângulo tendo comoextremos os quartis e englobando a mediana.Calcular a distância interquartil, isto é:
DQ = Q3 – Q1
Determinar os limites dos pontosdiscrepantes:
Q1 – 1,5 DQ
Q3 + 1,5 DQ
2727
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
Qualquer valor abaixo de Q1 – 1,5DQ ou acima de Q3 + 1,5 DQ seráconsiderado um valor discrepante(outlier). Para obter o diagrama caixa ebigode (boxplot) traçar duas linhas apartir do centro do retângulo e em ladosopostos até o último ponto do conjuntoque não seja um ponto discrepante.
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
Diagrama de Caixa e Bigodes - BoxPlot
x xx
Q1 Q2 Q3
D5,1+Q Q3DQD5,1-Q Q1
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
3 5 7 5 3 6 8 5 2
4 5 5 6 9 8 6 8 1
7 12 4 8 7 4 6
Obtenha o diagrama Caixa e Bigode parao número de paradas semanais paramanutenção de uma máquina.
Exemplo
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
Mínimo 1
Quartil um 4
Mediana 6
Quartil três 7
Máximo 12
Os cinco valores são:
Exemplo
Os demais são:
D 7 – 4 = 3
Q1- 1,5D -0,5
Q3 + 1,5D 11,5
Outlier 12
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
12
4=Q1 6=Q2 7=Q3
5,11=D5,1+Q Q33=DQD5,1-Q=5,0- Q1
91
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
Wilfredo Pareto
O Diagrama de Pareto é uma
homenagem ao engenheiro, filósofo,
sociólogo e economista italiano Vilfredo
Frederico Samaso Pareto (1848 - 1923).
Pareto foi um dos pioneiros na aplicação de
análises matemáticas ao estudo dos
fenômenos sócio-econômicos.
2828
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
Wilfredo enunciou, em 1897, o que
passou a ser conhecido como “PrincipioPrincipio
dede ParetoPareto” que afirma: “80% das
dificuldades tem origem em 20% dos
problemas”. Este principio poderia ser
colocado como existem muitos itens
triviais mas poucos vitais.
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
Diagrama
O Diagrama de Pareto é um gráfico de
colunas simples, onde a variável está em
ordem de importância freqüência de
ocorrência ou custo) dos problemas ou
defeitos.
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
Normalmente o diagrama envolve a
freqüência simples combinada com a
freqüência acumulada em um único
gráfico. É, também, comum a colocação de
um sistemas de eixos X’Y’ auxiliares.
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
Exemplo
Diagrama de Pareto
0
20
40
60
80
100
120
140
E B C F D A H I
Tipo de erro
Nú
me
ro d
e e
rro
s
0%
25%
50%
75%
100%
Triviais
Vitais
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
Exercício
Considerando os dados sobre o
“Defeitos” (Panilha “Exercício_3) do
Laboratório 2, construa um diagrama de
Pareto para os dados.
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
Defeitos Número de Azulejos
Desenho 71
Esmalte 95
Lascado 97
Maior 70
Menor 83
Torto 57
Trincado 27
Total 500
2929
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
Solução
Ordenando as freqüências
dadas e calculando as freqüências
relativas e relativas acumuladas,
tem-se:
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
Posições Relativas
A média e o desvio padrão são as duas
principais medidas utilizadas para descrever
um conjunto de dados. Elas, também,
podem ser utilizadas para comparações, isto
é, para fornecer a posição relativa de um
valor em relação ao conjunto como um todo.
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
O escore “z”
Seja (x1, x2, ..., xn) uma amostra de “n”
observações. Sejam e “s” a média e o
desvio padrão da amostra. Então o escore zi
é o valor que fornece a posição relativa de
cada xi da amostra, tendo como ponto de
referência a média e como medida de
afastamento o desvio padrão.
x
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
s
x-xz i
i=
O escore z fornece o número de
desvios padrão que cada valor está acima ou
abaixo da média. O escore –1,5, significa
que este valor está um desvio e meio abaixo
da média.
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
O escore Z é também uma variável,
que é obtida pela transformação da
amostra original. Ela apresenta média
igual a zero e desvio padrão igual a um.
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
Exemplo
Considere o seguinte amostra:
36 39 38 41 45 44 35 48 35 40
40 40 36 41 37 38 37 39 39 44
42 42 39 43 42 41 39 41 35 40
44 36 40 37 40 36 39 47 40 43
34 45 38 42 46 41 43 37 38 38
3030
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
0
1
2
3
4
5
6
7
34 35 36 37 38 39 40 41 42 43 44 45 46 47 48
37,0-Curtose
33,0Assimetria
=
=
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
Calcular os escores “zz” para cada
valor da amostra. Representar os
valores da amostras e os escores em
diagramas para verificar se houve
alteração no formato da distribuição dos
dados.
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
Solução:A média e o desvio padrão da amostra são:
40 e 3,2619. Então os escores padronizados serão:0,3066 0,9197 -0,9197 -0,6131 -0,6131
-1,2263 -0,3066 -0,6131 0,3066 1,5328
1,2263 -1,5328 2,4526 -1,5328 0,0000
0,0000 0,0000 -1,2263 0,3066 -0,9197
-0,6131 -0,9197 -0,3066 -0,3066 1,2263
0,6131 0,6131 -0,3066 0,9197 0,6131
0,3066 -0,3066 0,3066 -1,5328 0,0000
1,2263 -1,2263 0,0000 -0,9197 0,0000
-1,2263 -0,3066 2,1460 0,0000 0,9197
-1,8394 1,5328 -0,6131 0,6131 1,8394
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
0
1
2
3
4
5
6
7
-1,84 -1,23 -0,61 0,00 0,61 1,23 1,84 2,45
31,0-Curtose
37,0Assimetria
=
=
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
Propriedades
A média do escore padronizado é zero;
O desvio padrão do escore padronizado é
um.
A forma da distribuição do escore
padronizado é a mesma dos dados
originais.Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
Escalas
O escore Z não é utilizado
normalmente da forma como é
calculado. É comum a utilização de
uma escala linear de transformação.
As duas mais utilizadas são:
3131
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
EscalasA escala T que é obtida através da
seguinte transformação
TT == 1010..ZZ ++ 5050
A escala “A” que é utilizada nos
vestibulares é obtida por:
AA == 100100..ZZ ++ 500500Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
Teorema de Chebyshev
O teorema de Chebyshev permite
verificar qual é o percentual mínimo de
valores de um conjunto de dados que deve
estar um “certo número” de desvios em
torno da média.
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
Em qualquer conjunto de dados com
desvio padrão “s”, pelo menos
(1 – 1/z2) dos valores do conjunto devem
estar entre “z” desvios em torno da
média, onde “z” é um valor tal que
z > 1.
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
Exemplos:
Assim pelo menos:
75% dos valores estão dentro de z = 2desvios a partir da média;
89% dos valores estão dentro de z = 3desvios a contar da média;
94% dos valores estão dentro de z = 4desvios a contar da média.
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
1 - 1/4 = 75%.
S2<X-X