Upload
dangkhue
View
217
Download
0
Embed Size (px)
Citation preview
Métodos Quantitativos
PROF. DR. Renato Vicente
Método Estatístico
Amostra
PopulaçãoEstatística Descritiva
Teoria de Probabilidades
InferênciaEstatística
Aula 4A
Inferência Estatística: Um pouco de História
Um pouco mais de história: A Física Social
No tempo de Quetelet (Início do seculo 19) Probabilidades e Estatística eram utilizadas basicamente para análise de erros experimentais e para cálculo de seguros. Quetelet acreditava ser possível estender seu uso para todo tipo de fenômeno humano no que chamava de “Física Social”. Publicou em 1834 seu Essai de physique sociale. Introduziu a
Quetelet: 1796-1874
Essai de physique sociale. Introduziu a idéia do “homem médio”.
Galton e Darwin: Bioestatística
Após ler a Origem das Espécies, escrito por seu primo mais velho, Galton passou a se dedicar à Genética, dando origem ao ramo que levaria à Estatística moderna. Em 1869 Galton publicou Hereditary Genius tentando demonstrar quantitativamente que as características e habilidades as características e habilidades humanas seriam hereditárias.
Francis Francis GaltonGalton(1822(1822--1911)1911)Charles Darwin Charles Darwin
(1809(1809--1882)1882)
Quincunx de Galton
Galton propôs o aparato ao lado para ilustrar a formação da distribuição formação da distribuição normal.
http://www.jcu.edu/math/isep/Quincunx/Quincunx.html
Karl Pearson: Departamento de Estatística Protegido de Galton, Pearson escreveu sua biografia. Em 1911 foi responsável pela criação do primeiro Departamento de Estatística no mundo no University College London .
Sobre o trabalho de Galton escreveu: “Euinterpretei que... Galton ... quis dizer que há umacategoria mais ampla do que a conexão causal,que é a correlação,... e que este novo conceitoque é a correlação,... e que este novo conceitode correlação fez da psicologia, da antropologia,da medicina e da sociologia passíveis detratamento matemático. Foi Galton quem primeirome libertou do preconceito de que boa matemáticapoderia apenas ser aplicada a conexões de causae efeito em fenômenos naturais.”
Seu livro a Gramática da Ciência foi a primeiraleitura da Academia Olímpica, grupo de estudosliderado por Einstein quando tinha 23 anos.
Carl (Karl) Pearson (1857-1936)
Gosset (Student):Controle de Qualidade
William Gosset trabalhava na cervejaria Guinness.Em 1906, assistiu a um curso com Pearson. Juntos tiveram a idéia de aplicar métodos estatísticos no controle de qualidade da cervejaria. Por trabalhar na cervejaria, publicou seus artigos utilizando o pseudônimoStudent, pelo qual hoje conhecemos sua principal Student, pelo qual hoje conhecemos sua principal contribuição : o teste t de Student para testarmos hipóteses sobre a média amostral (veja exemplo dos Shoshoni e a razão áurea na Aula 2).
William Gosset (1876-1937)
Fisher: Estatística Moderna
Em 1913 Fisher enviou uma carta para Gosset Contendo uma justificativa teórica para a distribuição t. Esta seria o início de uma seqüência deu forma a boa parte da Estatística Moderna.
Em 1919 Fisher foi contratado pela Estação de Experimentos Agrícolas de Rothamstead , onde desenvolveu um grande número de ferramentas teóricas para exame de impactos agrícolas, entre teóricas para exame de impactos agrícolas, entre elas estavam métodos para estimação estatística, planejamento experimental e análise de variância.
William Gosset (1876-1937)
Aula 4B
A Distribuição Normal
A Distribuição Normal FUVEST 2007 - Distribuição dos pontos na Primeira Fase (incluindo Bônus e ENEM) Candidatos Inscritos - Total das Carreiras de Exatas
A distribuição normal é uma curva em forma de sino que aparece freqüentemente em todo tipo de observações.
Os parâmetros da distribuição normal
A distribuição Normal é totalmente descrita pela média e pelo desvio
padrão . Se mudarmos a média apenas deslocamos a curva pela abscissa. Se diminuirmos o desvio padrão tornamos a curva menos dispersa.
ms
Probabilidades de ocorrência
m
A freqüência de ocorrência dos dados em uma distribuição normal é bem definida para cada intervalo em torno da média.
Escore z
Sua altura é de 1,56 m. Você é alta?
Sua nota na FUVEST foi 60. Sua nota foi alta ?
O escore z permite que comparemos um valor específico com O escore z permite que comparemos um valor específico com a população levando-se em conta o valor típico e a dispersão.
A cada valor de z está associado um percentil.
valor – média
desvio padrão
Escore z
http://techniques.geog.ox.ac.uk/mod_2/tables/z-score.htm
Peso de Meninos por Idade
Como fui na FUVEST?
http://www.fuvest.br/scr/hist1f.asp?anofuv=2007&tipo=1&carreira=HUM
Média = 41,1 Desvio Padrão = 15
Z = (60 – 41,1)/15 = 1,26P(Z<1,26) = 89,6%
Sua a nota foi alta.
Você é baixinha?
Amostra : n=115 (alunos da EACH)
MÉDIA = 1,71 m DP = 9 cm
Z = (1,56 – 1,71)/0,09 = -1,67
P(Z<-1,67) = 4,7 %Você muito provavelmente não é das mais altas !
Aula 4B
Distribuição Amostral e Estimação
Estatísticas
Uma estatística é uma quantidade calculada a partir de amostras medidas em uma população.
0.693 0.662 0.690 0.606 0.570
Exemplo: A razão áurea e as molduras Shoshoni.
0.693 0.662 0.690 0.606 0.5700.749 0.672 0.628 0.609 0.8440.654 0.615 0.668 0.601 0.5760.670 0.606 0.611 0.553 0.933
A média, o desvio padrão, a mediana, os quartis, o máximo e o mínimo são estatísticas.
Distribuições amostrais
Uma distribuição amostral é a distribuição que obtemos quando calculamos uma estatística em várias amostras de uma população
Suponhamos que o quadro abaixo represente nossa população.
0.693 0.662 0.690 0.606 0.5700.749 0.672 0.628 0.609 0.8440.654 0.615 0.668 0.601 0.5760.670 0.606 0.611 0.553 0.933
nossa população.
Distribuições amostrais
0.693 0.662 0.690 0.606 0.5700.749 0.672 0.628 0.609 0.8440.654 0.615 0.668 0.601 0.5760.670 0.606 0.611 0.553 0.933
A média de nossa população é µ = 0,6605 e o desvio padrão populacional é σ=0,09. A distribuição está representada ao lado.
0.670 0.606 0.611 0.553 0.933
Coletando 4 amostras com tamanho n=2 obtivemos:
=0.721 =0.6435
=(0.628+0.668)/2=0.648
=(0.844+0.576)/2=0.710
Distribuições amostrais
0.693 0.662 0.690 0.606 0.5700.749 0.672 0.628 0.609 0.8440.654 0.615 0.668 0.601 0.5760.670 0.606 0.611 0.553 0.933
A média amostral (média das médias de amostras) é µa = 0,668 e o desvio padrão amostral é σa=0.066.
Médias amostrais.Repare que esta é mais 0.670 0.606 0.611 0.553 0.933
Coletando 4 amostras com tamanho n=2 obtivemos:
=0.721 =0.6435
=(0.628+0.668)/2=0.648
=(0.844+0.576)/2=0.710
esta é mais estreita que a distribuiçãopopulacional
Distribuições amostrais
0.693 0.662 0.690 0.606 0.5700.749 0.672 0.628 0.609 0.8440.654 0.615 0.668 0.601 0.5760.670 0.606 0.611 0.553 0.933
E se as amostras forem maiores, n=8 por exemplo.
0.670 0.606 0.611 0.553 0.933
Aqui temos 2 amostras com tamanho n=8
µa= 0,6606σa=0,025
Distribuições amostrais
ResumindoTamanho daAmostra (n)
Média das médias de amostraµa
Desvio padrão amostralσa
2 0,6680 0,066
8 0,6606 0,025
20 (população) 0,6605 0,09
Teorema do Limite Central
Para uma variedade ampla de distribuições a distribuição das médias amostrais tende a uma
http://www.chem.uoa.gr/applets/AppletCentralLimit/Appl_CentralLimit2.html
tende a uma distribuição normal quando o número de amostras é grande.
Exemplo: Estimando a altura média da População
Amostra : n=115 (alunos da EACH)
1,71 m é um estimador para a média populacional
O desvio padrão DP=9cm é um estimador para o desvio padrão populacional.
Exemplo: Estimando a altura média da População
A distribuição amostral para amostras de tamanho n=115 terá média igual à média populacional e desvio padrão igual ao desvio padrão populacional dividido por √115 , ou seja
0,09/ √115 = 0,01
1,71 ± 0,01 m
Nossa estimativa será portanto
O quanto podemos confiar nessa estimativa da média ?
Exemplo: Estimando a altura média da População
O quanto podemos confiar nessa estimativa para a altura média ?
1,72m1,70m 1,74m1,68m
Note que: esta é a distribuição para nosso erro de estimativa da altura média.
Qualidade de Estimadores: Viés e Eficiência
Viés grande eficiência alta Viés pequeno eficiência baixa
Viés grande eficiência baixa Viés pequeno eficiência alta
Qualidade de Estimadores: Viés e Eficiência
Média Amostral= (x1 + x2 + x3 + ... + xn)/n é não-viesado e eficiente (eficiência máxima)
Desvio Padrão Amostral = RAIZ{ [(x1-Media)2 + (x2-Media)2 + ... (xn-Media)2]/ (n-1)}é não-viesado.