43
Unidade I ESTATÍSTICA APLICADA Prof. Luiz Felix

Estatística Aplicada Slides Unidade I

Embed Size (px)

Citation preview

Page 1: Estatística Aplicada Slides Unidade I

Unidade I

ESTATÍSTICA APLICADA

Prof. Luiz Felix

Page 2: Estatística Aplicada Slides Unidade I

O termo estatística

Provém da palavra Estado e foi utilizadooriginalmente para denominarlevantamentos de dados, cuja finalidadeera orientar o Estado em suas decisões.

Foi utilizado em épocas remotas paradeterminar o valor dos impostoscobrados dos cidadãos e até mesmopara determinar a estratégia de umanova batalha.

Page 3: Estatística Aplicada Slides Unidade I

Definição

Estatística é um conjunto de técnicas e métodos que nos auxiliam no processode tomada de decisão na presença de incerteza.

Exemplos de aplicações:

caracterização de perfil sócio-econômico;

análise de intenção de votos;

levantamento de pessoas com nível universitário.

Page 4: Estatística Aplicada Slides Unidade I

População e amostra

População conjunto de todos os itens(pessoas, coisas, objetos) que interessam ao estudo de um fenômenocoletivo segundo alguma característica.

Amostra qualquer subconjunto nãovazio de uma população.

Page 5: Estatística Aplicada Slides Unidade I

Estatística descritiva

Estatística descritiva é a parte da Estatística que tem por objetivodescrever os dados observados.

Exemplo: Índice Nacional de Preço aoConsumidor (INPC), que envolve asintetização dos aumentos dos produtos da cesta básica.

Page 6: Estatística Aplicada Slides Unidade I

Estatística indutiva

Estatística indutiva é a parte da Estatística que tem por objetivo obter e generalizar conclusões para a população a partir de uma amostra, através do cálculo de probabilidade. O cálculo de probabilidade é queO cálculo de probabilidade é que viabiliza a inferência estatística.

Exemplo: análise do mercado financeiro visando explicar tendênciasdas taxas de juros.

Page 7: Estatística Aplicada Slides Unidade I

Principais fases do método estatístico

Definição do problema

Planejamento

Coleta de dados

Apuração dos dados

Apresentação dos dados

Análise e interpretação dos dados

Page 8: Estatística Aplicada Slides Unidade I

Dados estatísticos

Quando se trabalha com a observação, a mensuração, a análise e a interpretação de números, esses números nos conduzem a índices inflacionários, índices de desemprego, probabilidade de determinado candidato ganhar asdeterminado candidato ganhar as eleições etc.

Tais números serão chamados de dados estatísticos.

Page 9: Estatística Aplicada Slides Unidade I

Dados brutos e rol

Dados brutos uma sequência devalores numéricos não organizados, obtidos diretamente da observação deum fenômeno coletivo. Exemplo: idade dos meus professores: 49 63 34 2749, 63, 34, 27.

Rol uma sequência ordenada dedados brutosExemplo: idade dos meus professores: 27, 34, 49, 63 ou 63, 49, 34, 27.

Page 10: Estatística Aplicada Slides Unidade I

Variáveis

Quantitativas

Contínuas – assumem qualquer valor em um intervalo. Ex.: idade.

Discretas – originam-se da contagem de itens. Ex.: quantidade de produtositens. Ex.: quantidade de produtos produzidos por dia.

Qualitativas

Nominais – definem categorias. Ex.: separação por sexo.

Por posto – dispõem os elementos em uma ordem de preferência. Ex.: primeiro, segundo...

Page 11: Estatística Aplicada Slides Unidade I

Interatividade

Qual das seguintes séries abaixo representa um rol?

a) X: 1, 2, 3, 5, 4, 6

b) Y: 6, 5, 4, 7, 8, 9

c) Z: 1 1 3 3 5c) Z: 1, 1, 3, 3, 5

d) K: 5, 1, 1, 3, 3

e) L: 2, 2, 7, 8, 9, 1

Page 12: Estatística Aplicada Slides Unidade I

Notação por índices

O símbolo xi (lê-se “x índice i”) irá representar qualquer um dos n valores assumidos pela variável x. (x1, x2, ..., xn). “n” é denominado índice e poderá assumir qualquer dos números entre 1, 2 3 4 n2, 3, 4..., n.

NOTAÇÃO SIGMA (∑):A maioria dos processos estatísticos irá exigir o cálculo da soma de um conjunto de números. A letra maiúscula grega sigma (∑) é utilizada para representarsigma (∑) é utilizada para representar essas somas.

Page 13: Estatística Aplicada Slides Unidade I

Medidas de tendência central

Quando estamos diante de um conjunto de dados, seja ele pequeno ou grande, em geral, buscamos medidas que possam ser usadas para indicar um valor que tende a representar melhor aquele determinado conjunto de númerosdeterminado conjunto de números.

As medidas mais usadas nesse sentido são as chamadas medidas de tendência central:

média;

mediana;mediana;

moda.

Page 14: Estatística Aplicada Slides Unidade I

Média aritmética

É um valor calculado para um grupo de dados, usado para descrevê-los. É o ponto de equilíbrio dos dados.

x = ∑ xix ∑ xi

n

xi : cada variável da amostra.

n: é o número total de observações.

Page 15: Estatística Aplicada Slides Unidade I

Média aritmética – exemplo

Calcule a média aritmética do conjunto de dados:

xi = 3, 5, 8, 12, 7, 25

x = ∑ x = 3 + 5 + 8 + 12 + 7 + 25 = 60 = 10

n 6 6

Interpretação: O valor médio dos dados é 10, ou seja, os valores deste conjunto , j , jde dados concentram-se em torno do 10.

Page 16: Estatística Aplicada Slides Unidade I

Média aritmética – exemplo

Calcule a média aritmética do conjunto de dados:

xi = 1, 1, 3, 5

x = ∑ x = 1 + 1 + 3 + 5 = 10 = 2,5

n 4 4

Interpretação: O valor médio dos dados é 2,5, ou seja, os valores deste conjunto de , , j , jdados concentram-se em torno do 2,5.

Page 17: Estatística Aplicada Slides Unidade I

Média aritmética ponderada

A cada valor xi deverá ser atribuído um peso wi .

xp = ∑ xi . wi

∑ w∑ wi

xi : cada variável da amostra.

wi : cada peso da amostra.

Page 18: Estatística Aplicada Slides Unidade I

Média aritmética ponderada –exemplo

Um aluno tirou as notas 7, 3, 6 e 5 em quatro avaliações que, respectivamente, tinham os pesos 2, 5, 1, 2. Calcule a média do aluno levando-se em conta os pesos das avaliações.

xp = ∑ xi . wi = 7.2 + 3.5 + 6.1 + 5.2 = 45 = 4,5

∑ wi 2 + 5 + 1 + 2 10

Page 19: Estatística Aplicada Slides Unidade I

Mediana

É um valor que separa o rol em duas partes deixando à sua esquerda o mesmo número de elementos que estão à sua direita. É o ponto que ocupa a posição central em uma série.

Se o número de elementos do rol forímpar, a mediana será o valor do meio.

Se o número de elementos do rol for par, a mediana será a média dos 2 valores do meio.

Podemos calcular a posição da mediana com a fórmula:

posmed = (n + 1)

2

Page 20: Estatística Aplicada Slides Unidade I

Mediana – exemplo

Determinar a mediana

xi = 2, 20, 12, 23, 20, 8, 12

Solução:

Rol xi: 2, 8, 12, 12, 20, 20, 23

n = 7, logo:

posmed = (7 + 1) = 8 = 4ª posição

2 2

A mediana é o elemento que ocupa a 4ª posição: mediana = 12posição: mediana = 12

Page 21: Estatística Aplicada Slides Unidade I

Mediana – exemplo

Determinar a mediana

xi = 7, 21, 13, 15, 10, 8, 9, 13

Solução:

Rol xi: 7, 8, 9, 10, 13, 13, 15, 21

n = 8, logo:

posmed = (8 + 1) = 9 = 4,5ª posição

2 2

Neste caso, deve-se tirar a média entre os 2 valores do meio para se obter a medianavalores do meio para se obter a mediana.md = 10 + 13 = 23 = 11,5

2 2

Page 22: Estatística Aplicada Slides Unidade I

Moda

É o valor de maior frequência em um conjunto de dados.

Se o conjunto de dados possui:

Uma moda unimodal

Duas modas bimodal Duas modas bimodal

Três modas trimodal

4 ou mais modas polimodal

Nenhuma moda amodal

Page 23: Estatística Aplicada Slides Unidade I

Moda – exemplos

Determinar a moda

xi = 2, 8, 3, 5, 4, 5, 3, 5, 5, 1

Solução: Rol xi: 1, 2, 3, 3, 4, 5, 5, 5, 5, 8

moda = 5 unimodal

Determinar a moda

xi = 5, 4, 3, 3, 5, 4

Solução: Rol xi: 3, 3, 4, 4, 5, 5

não existe moda amodal

Page 24: Estatística Aplicada Slides Unidade I

Interatividade

Para o seguinte conjunto de dados

xi = 5, 9, 7, 31, 21, 13, 13, 21,

determinar a média aritmética simples, a mediana e a moda.

a) Média = 15; mediana = 13; moda = 13 e 21a) Média = 15; mediana = 13; moda = 13 e 21

b) Média = 15; mediana = 26; moda = 13 e 21

c) Média = 14; mediana = 26; moda = 13

d) Média = 15; mediana = 13; moda = 21

e) Média = 14; mediana = 26; moda = 13 e 21e) Média = 14; mediana = 26; moda = 13 e 21

Page 25: Estatística Aplicada Slides Unidade I

Medidas de dispersão

Indicam o quanto os dados estão

dispersos em torno da região central.

Quanto maiores as medidas de dispersão, mais heterogêneos são os dados e ao contrário quanto menoresdados, e, ao contrário, quanto menores essas medidas, mais homogêneo o conjunto.

Analisaremos as seguintes medidas de dispersão:

lit d t t l amplitude total;

desvio padrão;

variância.

Page 26: Estatística Aplicada Slides Unidade I

Medidas de dispersão

Considere os seguintes conjuntos de valores das variáveis X, Y e Z:

X: 70, 70, 70, 70, 70

Y: 68, 69, 70, 71, 72

Z: 5 15 50 120 160Z: 5, 15, 50, 120, 160

Os 3 conjuntos apresentam a mesma média aritmética: 70.

Notamos que o conjunto X é mais homogêneo que os conjuntos Y e Z.

Page 27: Estatística Aplicada Slides Unidade I

Medidas de dispersão

Quando se deseja entender, analisar e descrever de forma adequada um determinado conjunto de dados, faz-se necessário dispor não apenas de informações relativas à média, mediana e modamoda.

É preciso que se disponha de informações relativas à variabilidade (dispersão) dos números que compõem o referido conjunto de dados.

Essas medidas de variabilidade ou dispersão indicam se os dados observados estão próximos ou separados uns dos outros.

Page 28: Estatística Aplicada Slides Unidade I

Amplitude total

A amplitude total, ou intervalo, de um determinado conjunto de dados é obtido pela diferença entre o maior e o menor valor nesse conjunto de números.

Amplitude Total = Valor Máximo – Valor Mínimo

Sendo xi: 7, 8, 9, 10, 13, 20

Amplitude Total = 20 – 7 = 13

Page 29: Estatística Aplicada Slides Unidade I

Desvio médio

A dispersão dos dados em relação à média de uma sequência pode ser avaliada através dos desvios de cada elemento da sequência em relação à média da sequência.

DMédio = ∑ | xi x |

n

Em que n é o número de observações.

Exemplo de | x |

| 3 | = 3

| 3 | = 3

Page 30: Estatística Aplicada Slides Unidade I

Desvio médio – exemplo

Para o conjunto de dados xi = 2, 8, 4, 6, calcule o desvio médio.

Solução: DMédio = ∑ | xi x |

n

x = 2 + 8 + 4 + 6 = 20 = 5x = 2 + 8 + 4 + 6 = 20 = 5

4 4

DM = | 2 5 | + | 8 5 | + | 4 5 | + | 6 5 |

4

D = | 3| + | 3 | + | 1| + | 1 | = 3 + 3 + 1 + 1DM = | 3| + | 3 | + | 1| + | 1 | = 3 + 3 + 1 + 1

4 4

DM = 2

Page 31: Estatística Aplicada Slides Unidade I

Variância e desvio padrão (população e amostra)

POPULAÇÃO

Variância: σ2 = ∑ (xi – x)2

n

Desvio Padrão: σ = σ2

AMOSTRA

Variância: S2 = ∑ (xi – x)2

n – 1

Desvio Padrão: S = S2

Page 32: Estatística Aplicada Slides Unidade I

Variância e desvio padrão (população) – exemplo

Para a população xi = 4, 5, 8, 5, calcule a variância e o desvio padrão.

Solução: σ2 = ∑ (xi x)2 e σ = σ2

n

x = 4 + 5 + 8 + 5 = 22 = 5 5x = 4 + 5 + 8 + 5 = 22 = 5,5

4 4

σ2 = (4 5,5)2 + (5 5,5)2 + (8 5,5)2 + (55,5)2

4

σ2 = ( 1 5)2 + ( 0 5)2 + (2 5)2 + ( 0 5)2 = 2 25σ2 = (1,5)2 + (0,5)2 + (2,5)2 + (0,5)2 = 2,25

4

Desvio padrão: σ = σ2 = 2,25 = 1,5

Page 33: Estatística Aplicada Slides Unidade I

Variância e desvio padrão (amostra) – exemplo

Para a amostra xi= 4, 5, 8, 5, calcule a variância e o desvio padrão.

Solução: S2 = ∑ (xi x)2 e S = S2

n – 1

x = 4 + 5 + 8 + 5 = 22 = 5 5x = 4 + 5 + 8 + 5 = 22 = 5,5

4 4

S2 = (4 5,5)2 + (5 5,5)2 + (8 5,5)2 + (55,5)2

4 – 1

S2 = ( 1 5)2 + ( 0 5)2 + (2 5)2 + ( 0 5)2 = 9 = 3S2 = (1,5)2 + (0,5)2 + (2,5)2 + (0,5)2 = 9 = 3

3 3

Desvio padrão: S = S2 = 3 = 1,73

Page 34: Estatística Aplicada Slides Unidade I

Interatividade

Para a população xi = 1, 9, 3, 7, 5, calcule a variância e o desvio padrão.

a) Variância = 7 e desvio padrão = 2,64

b) Variância = 8 e desvio padrão = 2,82

c) Variância = 9 e desvio padrão = 3c) Variância = 9 e desvio padrão = 3

d) Variância = 10 e desvio padrão = 3,16

e) Variância = 11 e desvio padrão = 3,31

Page 35: Estatística Aplicada Slides Unidade I

Distribuição de frequências

A distribuição de frequências é o modo de tratamento de dados utilizado quando é grande a quantidade de dados brutos, e passamos a agrupar os dados estatísticos em subconjuntos com características semelhantescaracterísticas semelhantes.

A distribuição de frequências é a organização de dados em classes ou intervalos, para determinar o número de observações ou a percentagem de observações de cada classe chamadaobservações de cada classe, chamada de frequência de classes.

Page 36: Estatística Aplicada Slides Unidade I

Distribuição de frequências

Classe: são intervalos que subdividem a amplitude total.

Limites de classe: são os limites extremos de cada classe.

Li é o menor valor das classes consideradas.

Ls é o maior valor das classes consideradas.

Amplitude de classe: é a diferença entre o limite Li e o Ls da classe e determina alimite Li e o Ls da classe e determina a amplitude das classes de uma distribuição de frequências.

h = Ls – Li

Page 37: Estatística Aplicada Slides Unidade I

Distribuição de frequências

Li = 140 Ls = 150

Nº de classes = 4

Amplitude da classe h = 10

Page 38: Estatística Aplicada Slides Unidade I

Alguns conceitos de uma distribuição de frequência

Frequência relativa %: é o quociente entre a frequência absoluta da i-ésima classe com o somatório das frequências, multiplicando esse resultado por 100:

fri% = fi . 100

n

Frequência acumulada: é o somatório da frequência absoluta da i-ésima classe com a frequência absoluta das classes anteriores.

Page 39: Estatística Aplicada Slides Unidade I

Distribuição de frequências –exemplo

A observação das notas de 30 alunos em uma prova mostrou os valores:

3; 4; 2,5; 4; 4,5; 6; 5; 5,5; 6,5; 7;

7,4; 2; 3,5; 5; 5,5; 8; 8,5; 7,5; 9; 9,5;

5; 5 5; 4 5; 4; 7 5; 6 5; 5; 6; 6 5; 65; 5,5; 4,5; 4; 7,5; 6,5; 5; 6; 6,5; 6.

Page 40: Estatística Aplicada Slides Unidade I

Distribuição de frequências –variável contínua

Rol

2; 2,5; 3; 3,5; 4; 4; 4; 4,5; 4,5; 5;

5; 5; 5; 5,5; 5,5; 5,5; 6; 6; 6; 6,5;

6,5; 6,5; 7; 7,4; 7,5; 7,5; 8; 8,5; 9; 9,5

xi fi fri% Fi Fri%

2 |-- 4 4 13,33 4 13,33

4 |-- 6 12 40 16 53,33

6 |-- 8 10 33 34 26 86 676 | 8 10 33,34 26 86,67

8 |-- 10 4 13,33 30 100

∑ 30 100 --- ---

Page 41: Estatística Aplicada Slides Unidade I

Distribuição de frequências –exemplo

xi fi fri% Fi Fri%

2 |-- 4 4 13,33 4 13,33

4 |-- 6 12 40 16 53,33

6 |-- 8 10 33,34 26 86,67

Alunos com nota > = 4 e menor 6: 12

|

8 |-- 10 4 13,33 30 100

∑ 30 100 --- ---

Alunos com nota menor que 6: 16

%Alunos com nota > = 4 e menor que 6: 40%

%Alunos com nota < que 6: 53,33%

Page 42: Estatística Aplicada Slides Unidade I

Interatividade

A observação das notas de 30 alunos em uma prova mostrou os seguintes valores conforme mostrado na distribuição de frequências abaixo. Indique qual o percentual de alunos com nota menor que 8.

a) 10%

b) 33,34%

c) 26%

d) 86,67%

Notas fi

2 |-- 4 4

4 |-- 6 12

6 |-- 8 10e) 13,33%

8 |-- 10 4

Page 43: Estatística Aplicada Slides Unidade I

ATÉ A PRÓXIMA!