Upload
internet
View
109
Download
0
Embed Size (px)
Citation preview
Introdução à Estatística
Prof. Marco Fisbhen
População e Amostra
• População (ou universo): conjunto de elementos com pelo menos uma característica comum. – Ex: estudantes univesitários, moradores de uma
mesma rua, pais de filhos únicos
• Amostra: subconjunto finito de uma população– Ex: 10% dos estudantes de uma turma, 20% dos
moradores de uma rua
Estatística Descritiva x Indutiva
• Estatística descritiva: métodos que buscam somente descrever e analisar certo grupo de dados, independentemente de serem extraídos de uma amostra ou de toda a população
• Estatística indutiva: parte da estatística que tira conclusões sobre a população partindo do conhecimento da amostra. – Se uma amostra é representativa de uma população,
e tiramos conclusões a respeito desta população com os dados extraídos da amostra, temos uma aplicação da estatística indutiva.
Amostragem
• Técnicas de seleção da amostra• A amostragem pode ser probabilística ou não-
probabilística• Probabilística:– Aleatória simples, – Sistemática,– Estratificada
Amostragem não-probabilística
• Inacessibilidade de toda a população• Amostragem a esmo• Amostragem intencional• Amostragem por voluntários
Variáveis
• Qualitativas – quando expressas por tipos ou atributos: – sexo (masculino ou feminino), – cor dos olhos (azuis, castanhos, etc.).
• Quantitativas – quando expressas por números.– Discretas: Enumeráveis. Obtidas por contagens– Contínuas: Não Enumeráveis. Obtidas por
medições
Técnicas de descrição Gráfica• Tabelas: quadro resumindo o nosso conjunto de observações.• Toda tabela deve conter: Título, Cabeçalho, Células e Fonte
Escola Altura (m)
A 1,65
B 1,71
C 1,63
D 1,67
E 1,70
F 1,69
Média Geral 1,675
Altura média dos estudantes do Ensino Médio de Japaraíbe
Fonte: Censo Escolar do Município de Japaraíbe, 2006
Título
Cabeçalho
Células
Fonte
Técnicas de descrição Gráfica• Gráficos
Técnicas de descrição Gráfica
• Cartogramas
Técnicas de descrição Gráfica
• Pictogramas
Distribuição de Frequência
Frequência simples: número de vezes que um valor foi observado.Frequência relativa: razão entre frequência simples e frequência totalFrequência acumulada: total das frequências de todos os valores inferiores aolimite superior de uma dada classe
Representações Gráficas
• Histogramas e Polígonos de frequência
Medidas de Tendência Central
• Média Aritmética: soma de todos os valores observados da variável dividida pelo número total de observações.
• A média aritmética é a medida de tendência central mais utilizada para representar a massa de dados.
Propriedades e observações sobre a média aritmética
• Depende de todos os dados coletados, sendo portanto afetada por valores extremos
• É única em um conjunto de dados e nem sempre tem existência real. A média não necessariamente é um dado da série de valores observados.
• Por depender de todos os valores observados, qualquer modificação nos dados fará com que a média fique alterada. – Somando-se, subtraindo-se, multiplicando-se ou
dividindo-se uma constante a cada valor observado, a média ficará acrescida, diminuída, multiplicada ou dividida deste mesmo valor.
Medidas de Tendência Central• Moda: o valor que mais se repete em uma sequência de
dados. • Considere a série: 1, 3, 4, 4, 4, 6, 8, 32
Como o valor que aparece com maior frequência é o “4”, ele é o valor modal, ou simplesmente a moda.
• Uma série numérica pode ser:– Amodal: quando nenhum valor se repete;– Modal: quando um valor se repete;– Bimodal: quando dois valores se repetem;– Trimodal: quando três valores se repetem;– Polimodal: quando mais do que três valores se repetem.
Medidas de Tendência Central• Mediana: valor que ocupa a posição central da série
de observações de uma variável, dividindo o conjunto em duas partes iguais.
• 50% dos valores são maiores ou iguais ao valor da mediana e 50% dos valores são menores ou iguais ao valor da mediana.
• Se a quantidade de dados for ímpar, a mediana é simplesmente o valor central, e se a quantidade de dados for par a mediana será a média aritmética dos dois valores centrais.
• Empregamos a mediana sempre que há valores extremos que afetam muito a média.
Medidas Separatrizes - Quartis
• Os quartis dividem o conjunto de valores em quatro subconjuntos de mesmo número de elementos
Medidas Separatrizes - Percentis• São os noventa e nove valores que dividem uma série de
dados em 100 partes com o mesmo número de elementos.• Indicamos o 1º percentil como P1, o 2º como P2 e assim por
diante.• É importante notar que P25 = Q1, P50 = Md e P75 = Q3
Medidas de Dispersão
• Amplitude Total (AT):– diferença entre o maior e o menor valor coletado– AT = xmax − xmin
Medidas de Dispersão
• Variância– média aritmética dos quadrados dos desvios
Medidas de Dispersão
• Desvio Padrão– Raiz quadrada da variância
– Propriedades:• Se somarmos ou subtrairmos uma constante de todos os
valores da série, o desvio padrão não se altera.• Se multiplicarmos ou dividirmos uma constante por todos os
valores da série, o desvio padrão será multiplicado ou divido por esta mesma constante.
Medidas de Dispersão
• Coeficiente de Variação– Grandeza admensional (sem unidades) e
ponderada pelo seu valor médio
Noções de Assimetria
• Se x = Md = Mo, a curva é simétrica• Se Mo < Md < x, a curva é assimétrica
positiva.• Se x < Md < Mo, a curva é assimétrica
negativa.
Distribuição Normal
• A variável X pode assumir qualquer valor real• Graficamente, a distribuição tem a forma de um sino,
simétrico em torno da média. A curva recebe o nome de Curva de Gauss o Curva Normal
• A área total sob a curva tem valor 1 e é a probabilidade da variável X assumir qualquer valor real. Dada a simetria da vurva, a probabilidade vale 0,5 para cada lado da média
Noções de probabilidade• probabilidade de um evento A é o número real
P(A), de modo que:
• Eventos complementares– p + q = 1
• Eventos independentes– probabilidade de que eles se realizem
simultâneamente é: p = p1 . p2
• Eventos mutuamente exclusivos– probabilidade de que um OU outro evento se realize
é: p = p1 + p2
Correlação
• Mede a força, ou grau de relacionamento entre duas variáveis.
• Quanto maior a correlação, maior a intensidade de relacionamento
Correlação
• Exemplo:Aluno Nota em Matemática Nota em Estatística
1 5 64 7.5 87 6.5 6
13 8 915 9.5 1022 3 426 5.5 531 9 1033 7 7.540 2 2.5
Coeficiente de Correlação• O valor de r varia de –1,00 a +1,00; • Um relacionamento positivo (r é +) indica uma correlação positiva entre
duas variáveis. Os valores altos (baixos) de uma das variáveis, correspondem valores altos (baixos) da outra;
• Um relacionamento negativo (r é -) indica uma correlação negativa entre duas variáveis. Os valores altos (baixos) de uma das variáveis,
correspondem valores baixos (altos) da outra.
Regressão
• Problema - descrever a relação entre duas variáveis de acordo com o modelo matemático: Y = aX + b
b = y – ax
Números Índices
• Usados para indicar variações relativas em quantidades, preços, ou valores de um artigo, durante um período de tempo ou em diferentes espaços
• Relativo de preço:• Relativo de quantidade:• Relativo de valor:
Índice Agregativo - Laspeyres
• caracteriza a variação de preços de um conjunto de bens (agregado)
Testes de Hipótese
• Hipótese nula x hipótese alternativa• Erros tipo I e tipo II• Nível de significância (α)• Tipos de testes– Média– Proporção– Diferença entre médias– Diferença entre proporções