Transcript
Page 1: Estatística Básica - utfpr.edu.br · Estatística Descritiva • A Estatística Descritiva se preocupa com a orggçanização, appçresentação e sintetização de dados. Utilizam

Estatística Básica

Page 2: Estatística Básica - utfpr.edu.br · Estatística Descritiva • A Estatística Descritiva se preocupa com a orggçanização, appçresentação e sintetização de dados. Utilizam

O que é Estatística ?O que é Estatística ?

• um conjunto de métodos e processos quantitativos que servem para estudar e medir q q pos fenômenos coletivos

• Aplicações em quase todas as áreas de• Aplicações em quase todas as áreas de conhecimento humano, inclusive Ciências da Computação

Page 3: Estatística Básica - utfpr.edu.br · Estatística Descritiva • A Estatística Descritiva se preocupa com a orggçanização, appçresentação e sintetização de dados. Utilizam

O que é analisar dados ?O que é analisar dados ?

Id tifi t t édi• Identificar comportamentos médios, comportamentos discrepantes, compara comportamentos investigar a interdependênciacomportamentos, investigar a interdependência entre variáveis, revelar tendências, etc.

• A partir de uma massa de dados e com auxílio deA partir de uma massa de dados, e com auxílio de recursos computacionais, separar o que é essencial (estrutura) do que é eventual (ruído)

• Resumir, de forma eficiente, a informação contida nos dados e assim permitir que, através dessse

h d õ d dconhecimento, as decisões sejam tomadas de forma mais consciente.

Page 4: Estatística Básica - utfpr.edu.br · Estatística Descritiva • A Estatística Descritiva se preocupa com a orggçanização, appçresentação e sintetização de dados. Utilizam

O que é Análise Exploratória ?O que é Análise Exploratória ?

• Trata‐se de um conjunto de técnicas de tratamento de dados, que, sem implicar em q puma fundamentação matemática mais rigorosa nos ajuda a fazer uma sondagemrigorosa, nos ajuda a fazer uma sondagem inicial, ou seja, tomar um primeiro contato com a informação disponívelcom a informação disponível

Page 5: Estatística Básica - utfpr.edu.br · Estatística Descritiva • A Estatística Descritiva se preocupa com a orggçanização, appçresentação e sintetização de dados. Utilizam

O que vem depois da Análise Exploratória ?

• Após a análise exploratória que fornece algumas pistas a respeito do estudo, podemos g p p ppartir para a chamada Inferência, em que serão aplicados aos dados métodos maisserão aplicados aos dados métodos mais sofisticados, cuja fundamentação matemática está no Cálculo de Probabilidadesestá no Cálculo de Probabilidades.

Page 6: Estatística Básica - utfpr.edu.br · Estatística Descritiva • A Estatística Descritiva se preocupa com a orggçanização, appçresentação e sintetização de dados. Utilizam

Áreas da EstatísticaÁreas da Estatística

• Estatística Descritiva

• Estatística InferencialEstatística Inferencial

Page 7: Estatística Básica - utfpr.edu.br · Estatística Descritiva • A Estatística Descritiva se preocupa com a orggçanização, appçresentação e sintetização de dados. Utilizam

Estatística DescritivaEstatística Descritiva

• A Estatística Descritiva se preocupa com a organização, apresentação e sintetização de g ç p ç çdados. Utilizam gráficos, tabelas e medidas descritivas como ferramentas Utilizada nadescritivas como ferramentas. Utilizada na etapa inicial da análise, destinada a obter informações que indicam possíveis modelos ainformações que indicam possíveis modelos a serem utilizados numa fase final que seria a chamada inferência estatística

Page 8: Estatística Básica - utfpr.edu.br · Estatística Descritiva • A Estatística Descritiva se preocupa com a orggçanização, appçresentação e sintetização de dados. Utilizam

Vocabulário básico de estatísticaVocabulário básico de estatística

• População: Coleção completa de todos os elementos que são objeto de nosso estudo.q j

• Amostra: Subconjunto de elementos selecionados da população segundo regrasselecionados da população segundo regras bem definidas.

• Variável: Corresponde a uma característica de um item ou de um indivíduo.um item ou de um indivíduo.

Page 9: Estatística Básica - utfpr.edu.br · Estatística Descritiva • A Estatística Descritiva se preocupa com a orggçanização, appçresentação e sintetização de dados. Utilizam

VariáveisVariáveis

• Ao se fazer um estudo estatístico de um determinado fato ou grupo, tem‐se que g p qconsiderar o tipo de variável:– Variáveis qualitativas; ou– Variáveis qualitativas;  ou 

– Variáveis quantitativas

Page 10: Estatística Básica - utfpr.edu.br · Estatística Descritiva • A Estatística Descritiva se preocupa com a orggçanização, appçresentação e sintetização de dados. Utilizam

Variáveis QualitativasVariáveis Qualitativas

• Nominal ou categórica: seus valores possíveis são diferentes categorias não ordenadas, em gque cada observação pode ser classificada.Ex: Raça nacionalidade área de atividadesEx: Raça, nacionalidade, área de atividades.

• Ordinal: seus valores possíveis são diferentes categorias ordenadas, em que cada observação pode ser classificada.ç p

Ex: classe social, nível de instrução.

Page 11: Estatística Básica - utfpr.edu.br · Estatística Descritiva • A Estatística Descritiva se preocupa com a orggçanização, appçresentação e sintetização de dados. Utilizam

Variáveis QuantitativasVariáveis Quantitativas

• Discreta: Seus valores possíveis são em geral resultados de um processo de contagem. p g

Ex: número de filhos, número de séries escolares cursadas com aprovação;escolares cursadas com aprovação;

• Contínua: seus valores possíveis podem ser expressos através de números reais e varem uma escala contínua de mediçãouma escala contínua de medição

Ex: Renda mensal, peso, altura.

Page 12: Estatística Básica - utfpr.edu.br · Estatística Descritiva • A Estatística Descritiva se preocupa com a orggçanização, appçresentação e sintetização de dados. Utilizam

ExemploExemplo

• Exemplo: Pesquisa antropométrica: amostra de 45 mulheres idosas acima de 60 anos (xls)( )

Page 13: Estatística Básica - utfpr.edu.br · Estatística Descritiva • A Estatística Descritiva se preocupa com a orggçanização, appçresentação e sintetização de dados. Utilizam

Distribuição de Frequências – Tabelas e Gráficos

• Tabelas (Para uma variável qualitativa):– Cada linha corresponde a um valor possível da variável

– Através de um processo de contagem são obtidos os valores que constam na coluna de frequência da tabela.  O resultado dessa contagem é chamada de frequência absoluta;

– A partir das frequências absolutas podem ser também calculadas frequência relativas, usualmente apresentada sob a forma de percentuais.

Page 14: Estatística Básica - utfpr.edu.br · Estatística Descritiva • A Estatística Descritiva se preocupa com a orggçanização, appçresentação e sintetização de dados. Utilizam

Distribuição de Frequências – Tabelas e Gráficos

• Gráfico (Para uma variável qualitativa): Barras

40 00%

50,00%

60,00%

40,00%

50,00%

60,00%

20,00%

30,00%

40,00%

Ativa

Sedentária

0 00%

10,00%

20,00%

30,00%

, %

0,00%

10,00%

1

0,00%Pequeno Risco

Médio Risco

Grande Risco

Page 15: Estatística Básica - utfpr.edu.br · Estatística Descritiva • A Estatística Descritiva se preocupa com a orggçanização, appçresentação e sintetização de dados. Utilizam

Distribuição de Frequências – Tabelas e Gráficos

• G áfi (P iá l lit ti ) S t i t t• Gráfico (Para uma variável qualitativa): Setores – pizza ou torta

Pequeno Risco; 11,11%

Grande

Ativa; 48,89%Sedent

ária; 51 11%

Médio Risco; 44,44%

Grande Risco; 44,44%

Pequeno Risco

Médio Risco

Grande Risco

51,11% ,

Page 16: Estatística Básica - utfpr.edu.br · Estatística Descritiva • A Estatística Descritiva se preocupa com a orggçanização, appçresentação e sintetização de dados. Utilizam

Observação sobre cada tipo de gráficoObservação sobre cada tipo de gráfico

O áfi d t ã i li• O gráfico de setores, por não implicar uma ordenação das categorias, é mais apropriado para as variáveis qualitativas nominaisas variáveis qualitativas nominais

• O gráfico de barras, em que as categorias estão naturalmente ordenadas é mais apropriado paranaturalmente ordenadas, é mais apropriado para as variáveis qualitativas ordinais

• Para representar a distribuição de frequência dePara representar a distribuição de frequência de uma variável através de um gráfico de setores é importante que a variável não possua muitas 

d f l l ã dcategorias, pois isto dificulta a visualização das proporções.

Page 17: Estatística Básica - utfpr.edu.br · Estatística Descritiva • A Estatística Descritiva se preocupa com a orggçanização, appçresentação e sintetização de dados. Utilizam

Tabelas de Frequências para variáveis quantitativas

• No caso de variáveis quantitativa discreta com um pequeno número de valores possíveis (por exemplo, número de filhos), a construção de uma tabela de frequência segue os mesmos moldes do q gque visto para variáveis qualitativas;

• Antes de mais nada é necessário dividir o seu• Antes de mais nada é necessário dividir o seu intervalo de variação em vários subintervalos (de preferência todos eles com a mesma amplitude)preferência todos eles com a mesma amplitude).

Page 18: Estatística Básica - utfpr.edu.br · Estatística Descritiva • A Estatística Descritiva se preocupa com a orggçanização, appçresentação e sintetização de dados. Utilizam

Tabelas de Frequência para Variáveis Quantitativas

Faixa Etária Frequência Percentuais

60 — 65 16 35,56

65 — 70 16 35,56

70 — 75 12 26,67

75 — 80 1 2,22

Total 45 100

20

Histograma

05

101520

65 70 75 80 MaisFreq

üência

Freqüência

65 70 75 80 Mais

Intervalo

Page 19: Estatística Básica - utfpr.edu.br · Estatística Descritiva • A Estatística Descritiva se preocupa com a orggçanização, appçresentação e sintetização de dados. Utilizam

Gráfico Ramo FolhaGráfico Ramo‐Folha

61 69 61 71 63 71 72 68 66 69 72 67 63 66 6363 60 67 71 63 60 69 64 63 66 71 64 70 63 66 64 69 69 64 63 72 73 68 71 72 69 68 68 73 79

60‐64   6  61 61 63 63 63 63 60 63 60 64 63 64 63 64 64 64 65 69 6 69 68 66 69 67 66 67 69 66 66 69 69 68 69 68 6865‐69   6  69 68 66 69 67 66 67 69 66 66 69 69 68 69 68 6870‐74   7  71 71 72 72 71 71 70 72 73 71 72 7375 79 7 7975‐79   7  7980‐84   8   0

Page 20: Estatística Básica - utfpr.edu.br · Estatística Descritiva • A Estatística Descritiva se preocupa com a orggçanização, appçresentação e sintetização de dados. Utilizam

Gráfico Ramo FolhaGráfico Ramo‐Folha

60 64 6 61 61 63 63 63 63 60 63 60 64 63 64 63 64 64 6460‐64   6  61 61 63 63 63 63 60 63 60 64 63 64 63 64 64 64 65‐69   6  69 68 66 69 67 66 67 69 66 66 69 69 68 69 68 6870 74 7 71 71 72 72 71 71 70 72 73 71 72 7370‐74   7  71 71 72 72 71 71 70 72 73 71 72 7375‐79   7  7980‐84 8 080‐84   8   0

6 001133333334444 166 001133333334444            166     666677888899999 167     01111122233 127     1 18     0 0

Page 21: Estatística Básica - utfpr.edu.br · Estatística Descritiva • A Estatística Descritiva se preocupa com a orggçanização, appçresentação e sintetização de dados. Utilizam

ObservaçãoObservação

f d di idi i l d l• Se a forma de dividir o intervalo de valores em subintervalos e a maneira de escolher os ramos forem as mesmas (ou equivalentes), o gráfico ramo‐folha e o histograma são praticamente a mesma figura.

• Entretanto, o ramo‐folha é mais informativo ,porque o valor numérico de cada observação não é perdido. No caso da idade, toda anão é perdido.  No caso da idade, toda a informação numérica foi preservada.

Page 22: Estatística Básica - utfpr.edu.br · Estatística Descritiva • A Estatística Descritiva se preocupa com a orggçanização, appçresentação e sintetização de dados. Utilizam

Medidas de centralidade para variáveis quantitativas

Médi A it étin

• Média Aritmética

• Medianan

x

nxxxx ni

in

...21

• MedianaSeja x(1) ≤ x(2) ≤ ... ≤ x(n) os mesmos valores que 

compõem a amostra, porém disposto em ordem p , p pcrescente.

Mediana dos dados é:

• Modad d d d é l l d

central posição de observaçãoda par valor é n se central, posição de sobservaçõe duas das valoresdosmédia

imparénsecentral,posição deobservaçãoda valor Mediana(x)

– A moda dos dados é aquele valor da amostra que ocorre com maior frequência

Page 23: Estatística Básica - utfpr.edu.br · Estatística Descritiva • A Estatística Descritiva se preocupa com a orggçanização, appçresentação e sintetização de dados. Utilizam

Medidas de Dispersão para variáveis quantitativas

V iâ i n• Variância:1

)(1

2

2

n

xxs

n

ii

• Desvio‐padrão:

1

)(1

2

n

xxs

n

ii

• Quartil:– O primeiro quartil Q1 tem ¼ dos dados abaixo dele e ¾ d d d i d l

1n

¾ dos dados acima dele.– O terceiro quartil Q3 tem ¾ dos dados abaixo dele e ¼ dos dados acima deledos dados acima dele

– O segundo quartil Q2 é a própria mediana– A distância interquartil é dada por DIQ = Q3 – Q1q p Q Q Q

Page 24: Estatística Básica - utfpr.edu.br · Estatística Descritiva • A Estatística Descritiva se preocupa com a orggçanização, appçresentação e sintetização de dados. Utilizam

Identificação de discrepância em variáveis quantitativas

• Dois critérios recomendados:– Eliminar toda observação que estiver fora do ç qintervalo 

– Limite inferior = ou

).3;.3( SxSx

DIQQ 3 DIQQ

3Limite inferior =             ou 

l

DIQQ 21 DIQQ

21

– Exemplo

Page 25: Estatística Básica - utfpr.edu.br · Estatística Descritiva • A Estatística Descritiva se preocupa com a orggçanização, appçresentação e sintetização de dados. Utilizam

BOX PLOTBOX PLOT

• É áfi tili d i t ti fi á i• É um gráfico utilizado para sintetizar em uma mesma figura várias informações relativas à distribuição de uma determinada variável quantitativa

I i i l t é t d tâ l j b l ã– Inicialmente é traçado um retângulo cuja base no qual serão apresentados os valores da variável considerada.

– Depois se desenha um retângulo cuja base inferior corresponde à posição do primeiro quartil (Q1) e cuja base superior corresponde àposição do primeiro quartil (Q1) e cuja base superior corresponde à posição do terceiro quartil Q3.  A posição da mediana é indicada por um traço horizontal no interior do retângulo

– Em seguida são trançados dois segmentos de reta verticais, em que g ç g , qum deles vai desde o ponto médio da base inferior do retângulo até a posição da menor observação não discrepante, e outro vai desde o ponto médio da base superior do retângulo até a posição da maior observação não discrepanteobservação não discrepante.

– Cada uma das observações discrepantes é explicitada.

Page 26: Estatística Básica - utfpr.edu.br · Estatística Descritiva • A Estatística Descritiva se preocupa com a orggçanização, appçresentação e sintetização de dados. Utilizam

B Pl tBox‐Plot• Exemplo 6: 7 9 12 15 17 21 23• Exemplo 6: 7  9  12  15  17  21  23

Q1 = 9 Q2 = 15 Q3 =21

25

20

23 Max

Q3

15C1

Q2

10

7 Min

Q1

Min