24
1 MATERIAL DIDÁTICO ESTATÍSTICA Profa. Valeria Ap. Martins Ferreira

Apostila - Estatística1

Embed Size (px)

DESCRIPTION

Curso de Estatística

Citation preview

Page 1: Apostila - Estatística1

1

MATERIAL DIDÁTICO

ESTATÍSTICA

Profa. Valeria Ap. Martins Ferreira

Page 2: Apostila - Estatística1

2

1 Introdução à Estatística

Em muitas ocasiões do nosso cotidiano nos deparamos com situações em que

precisamos trabalhar com grande quantidade de informações. Neste material de apoio

formalizaremos alguns conceitos e técnicas estatísticas que podem ser utilizados na

análise de conjuntos de dados, de forma objetiva e segura.

Para começar nossos estudos vamos definir alguns conceitos importantes:

Estatística: Conjunto de técnicas que permite, de forma sistemática, organizar,

descrever, analisar e interpretar dados (conjunto de valores numéricos ou não)

provenientes de estudos ou experimentos, realizados em qualquer área do

conhecimento.

A Estatística pode ser dividida, basicamente, em três áreas:

Estatística Descritiva

Probabilidade

Inferência Estatística

Estatística Descritiva: Conjunto de técnicas destinadas a descrever e resumir os dados a

fim de que possamos tirar conclusões a respeito da característica de interesse.

Probabilidade: Teoria matemática utilizada para se estudar a incerteza proveniente de

fenômenos de caráter aleatório.

Inferência Estatística: Estudo de técnicas que possibilitam a extrapolação, a um grande

conjunto de dados, das informações e conclusões obtidas a partir de subconjuntos de

valores, usualmente de dimensão muito menor, denominados amostras.

Page 3: Apostila - Estatística1

3

Estatística Descritiva

Interpretações Iniciais

Amostra

Inferência Estatística

Estimação de quantidades desconhecidas

Extrapolação dos resultados

Teste de Hipótese

Fonte: Magalhães, Marcos Nascimento e Lima, Antonio Carlos Pedroso. Noções de

Probabilidade e Estatística.

A seleção da amostra pode ser feita de várias maneiras, dependendo, entre outros

fatores, do grau de conhecimento que temos da população, da quantidade de recursos

disponíveis e assim por diante. Devemos ressaltar que a seleção da amostra tenta

fornecer um subconjunto de dados o mais parecido possível com a população que lhe dá

origem. Os dados amostrais devem ser coletados de modo apropriado, tal como através

de um processo de seleção aleatória.

1.1 Definições Elementares de Estatística

População: Conjunto formado por todos os elementos (indivíduos, objetos e outros) que

contém a característica que temos interesse em estudar.

Amostra: Subconjunto formado por elementos da população.

Parâmetro: Medida numérica que descreve alguma característica de uma população.

Estatística: Medida numérica que descreve alguma característica de uma amostra.

Variável: Característica de interesse no estudo.

População

Page 4: Apostila - Estatística1

4

As variáveis podem ser classificadas como qualitativas ou quantitativas. As

variáveis numéricas serão denominadas quantitativas, ao passo que as não numéricas,

qualitativas.

A variável é qualitativa quando resultar de uma classificação por atributos e/ou

qualidades. Se existir uma ordenação natural, indicando intensidades crescentes de

realização, então elas são classificadas como qualitativas ordinais. Caso contrário, elas

são classificadas como variáveis qualitativas nominais.

Exemplos de variáveis qualitativas nominais:

Gênero (feminino ou masculino)

Estado Civil (solteiro, casado, viúvo, divorciado)

Exemplos de variáveis qualitativas ordinais:

Classe Social (baixa, média ou alta)

Desempenho de um professor (péssimo, regular ou bom)

A variável será quantitativa quando seus valores forem expressos em números.

As variáveis quantitativas podem ser subdivididas em quantitativas discretas e

quantitativas contínuas. As variáveis quantitativas discretas podem ser vista como

resultantes de contagens, assumindo, em geral, valores inteiros. Já as quantitativas

contínuas assumem valores em intervalos dos números reais e, geralmente, são

provenientes de uma mensuração.

Exemplos de variáveis quantitativas discretas:

Número de dependentes (0,1,2,...)

Número de irmãos (0,1,2,3,...)

Exemplos de variáveis quantitativas contínuas:

Peso

Altura

Page 5: Apostila - Estatística1

5

Observações:

1. Podemos discretizar uma variável contínua para obter uma melhor representação

da ocorrência de seus valores no conjunto de dados.

2. Podemos associar códigos numéricos a uma variável qualitativa. Por exemplo,

para a variável gênero podemos associar o valor 1 ao sexo feminino e 2 ao

masculino. Apesar da variável ser representada por valores numéricos, isto não

a torna uma variável quantitativa.

1.2 Coleta de Dados

O objetivo de qualquer estudo estatístico é coletar dados e então usá-los para

uma tomada de decisão. Toda decisão feita usando os resultados de um estudo

estatístico será tão boa quanto foi o processo de obtenção dos dados.

Há várias maneiras de coletar os dados. A seguir são apresentados quatro

métodos de coleta de dados.

Censo: todos os elementos da população são estudados. Apesar de fornecer

informações completas, é frequentemente dispendioso e difícil de ser realizado.

Amostra: subconjunto da população de interesse. As estatísticas calculadas a

partir da amostra são usadas para predizer vários parâmetros populacionais.

Simulação: utilização de um modelo matemático ou físico para reproduzir as

condições de uma situação ou de um processo. As simulações permitem estudar

situações que seria pouco prático ou até mesmo perigoso criar na vida real, além de

frequentemente poupar tempo e dinheiro. Por exemplo, fabricantes de automóveis usam

simulações com bonecos para estudar os efeitos que as colisões têm em seres humanos.

Experimento: ao se realizar um experimento, é aplicado um tratamento a uma

parte da amostra e são observadas as respostas. Uma segunda parte da amostra é, em

geral, usada como um grupo de controle. Esse grupo não recebe tratamento algum ou

então recebe um placebo. Após serem observadas as respostas dos dois grupos, os

resultados são comparados.

Page 6: Apostila - Estatística1

6

1.2.1 Técnicas de amostragem

Para coletar dados não tendenciosos, é importante que a amostra seja

representativa da população. Técnicas de amostragem apropriadas devem ser usadas

para garantir que as inferências sobre a população sejam válidas.

“Se os dados amostrais não forem coletados de maneira adequada, eles podem

ser de tal modo inúteis que nenhuma manipulação estatística poderá salvá-los”.

A seguir definiremos os métodos de amostragem mais comuns.

Em uma amostra aleatória, todos os membros da população têm chances iguais

de serem selecionados.

Uma amostra aleatória simples é aquela na qual toda amostra possível de

mesmo tamanho tem a mesma chance de ser selecionada. Por exemplo: para usar uma

amostra aleatória simples na contagem do número de pessoas que vivem nos domicílios

da cidade de Mococa, você pode atribuir um número diferente para cada domicílio, usar

um computador para gerar uma amostra de números aleatórios e depois contar o número

de pessoas que vive em cada domicílio selecionado.

Exemplo 1: Imagine uma sala de aula com 60 alunos arrumados em seis filas de 10

alunos cada. Suponha que o professor selecione uma amostra de 10 alunos jogando um

dado e selecionando a fila correspondente ao resultado da jogada. O resultado é uma

amostra aleatória? É amostra aleatória simples? É amostra probabilística?

Resolução: A amostra é uma amostra aleatória porque cada estudante em si tem a

mesma chance (uma chance em seis) de ser escolhido. No entanto, a amostra não é uma

amostra aleatória simples porque nem todas as amostras de tamanho 10 têm a mesma

chance de serem escolhidas. Por exemplo, esse planejamento amostral, ao usar um dado

para selecionar uma fileira, torna impossível selecionar 10 estudantes que estejam em

filas diferentes (mas há uma chance em seis de que sejam selecionados os 10 estudantes

da primeira fila). A amostra é uma amostra probabilística porque cada estudante tem

uma chance conhecida (uma chance em seis) de ser selecionado.

Page 7: Apostila - Estatística1

7

Na escolha dos membros de uma amostra, as pessoas envolvidas no

estudo/pesquisa devem decidir se é aceitável ou não ter o mesmo membro da população

selecionado mais de uma vez. Se for aceitável, diz-se que o processo de amostragem é

feito com reposição. Se não for aceitável, então diz-se que o processo é feito sem

reposição.

Uma amostra sistemática é aquela na qual é atribuído um número a cada

elemento da população. Os elementos da população são então ordenados de alguma

maneira, o número inicial é selecionado aleatoriamente e depois os membros da amostra

são selecionados segundo intervalos regulares que ocorrem a partir do número inicial.

(Por exemplo, cada terceiro, quinto ou centésimo elemento é selecionado). Por

exemplo, para coletar uma amostra sistemática do número de pessoas que vivem nos

domicílios de Mococa, você poderia atribuir um número diferente para cada domicílio,

escolher aleatoriamente um número inicial, selecionar um domicílio a cada cem e contar

então o número de pessoas que vivem em cada um desses domicílios selecionados.

Em uma amostra estratificada, a população é subdividida em, pelo menos, dois

subgrupos (estratos) de modo que os elementos no mesmo subgrupo compartilhem as

mesmas características (tais como gênero ou faixa etária) e em seguida extrai-se uma

amostra de cada subgrupo (ou estrato). O emprego de uma amostra estratificada nos

assegura que cada segmento da população está representado.

Na amostragem por conglomerados, primeiro dividimos a área da população em

seções (ou conglomerados), depois selecionamos aleatoriamente alguns desses

conglomerados e a seguir escolhemos todos os membros desses conglomerados

selecionados. Um exemplo de amostragem por conglomerado pode ser encontrado nas

pesquisas eleitorais, onde selecionamos aleatoriamente 30 zonas eleitorais dentre um

grande número de zonas e, em seguida, entrevistamos todos os eleitores daquelas zonas

selecionadas. Isso é muito mais rápido e muito menos dispendioso do que selecionar

uma pessoa de cada uma das muitas zonas na área populacional.

Na amostragem de conveniência, simplesmente usamos resultados de muito

fácil obtenção. Este tipo de amostragem leva frequentemente a estudos tendenciosos (e

que, portanto, não é recomendável).

Page 8: Apostila - Estatística1

8

Mesmo planejando e executando bem o processo de coleta da amostra,

provavelmente haverá algum erro nos resultados. Por exemplo, se selecionarmos

aleatoriamente 500 adultos e perguntarmos se eles completaram o ensino superior,

encontraremos um percentual de respostas “sim”. Agora, se selecionarmos outra

amostra de 500 adultos, é provável que obtenhamos um percentual de respostas “sim”

diferente. Com esta reflexão, chegamos às seguintes definições:

Erro amostral: É a diferença entre o resultado amostral e o verdadeiro resultado da

população; tais erros resultam das flutuações amostrais devidas ao acaso.

Erro não amostral: Ocorre quando os dados amostrais são coletados, registrados ou

analisados incorretamente (tal como a seleção de uma amostra tendenciosa, o registro

incorreto dos dados ou o uso de um instrumento de medida defeituoso).

1.3 Organização dos dados

A partir de agora apresentaremos métodos importantes para organização, resumo

e obtenção de gráficos de um conjunto de dados. A finalidade não é a simples obtenção

de tabelas e gráficos, mas, sim, a compreensão dos dados. Quando exploramos um

conjunto de dados, as seguintes características são, usualmente, de grande importância:

1. Centro: um valor representativo ou médio, que indica onde se localiza o meio

do conjunto de dados.

2. Variação: uma medida de quanto os valores dos dados variam entre eles.

3. Distribuição: a natureza ou forma da distribuição dos dados (tal como em

forma de sino, uniforme ou assimétrica).

4. Outliers ou Valores Discrepantes: valores amostrais que se localizam muito

longe da grande maioria dos outros valores amostrais.

1.3.1 Distribuição de Frequência

Ao estudarmos grandes conjuntos de dados é conveniente organizá-los e resumi-

los, construindo uma tabela de frequências. Esta tabela conterá os valores ou categorias

da variável em estudo e suas respectivas contagens, as quais são denominadas

Page 9: Apostila - Estatística1

9

frequências. Para facilitar a compreensão da distribuição e a comparação de diferentes

conjuntos de dados calculamos a frequência relativa (%) definida por:

100sobservaçõe de totalnº

categoria na frequência(%) FR

Exemplo 2: Considere um problema de pesquisa de opinião. Nessa pesquisa, 280

alunos de uma universidade foram consultados a respeito de suas opiniões sobre o

desempenho de um professor de Estatística. Na Tabela 1, temos as frequências

observadas e as frequências relativas para cada categoria de resposta (bom, regular,

péssimo).

Tabela1: Pesquisa de opinião

Desempenho

do professor

Frequência F.R(%)

Bom 152 54,29

Regular 77 27,50

Péssimo 51 18,21

Total 280 100,00

Exemplo 3: Uma determinada empresa resolveu traçar o perfil socioeconômico de seus

empregados. Uma das variáveis estudadas foi o número de filhos, com idade inferior a

18 anos, de cada um dos empregados. A Tabela 2 fornece a frequência e a frequência

relativa (%) para cada valor obtido.

Tabela2: Frequência dos empregados, segundo o número de filhos.

Número de

Filhos

Frequência F.R(%)

0 6 13,33

1 11 24,44

2 13 28,89

3 7 15,56

4 5 11,11

5 1 2,22

6 2 4,44

Total 45 100,00

Page 10: Apostila - Estatística1

10

1.3.2 Organização dos dados em classes

Na construção da distribuição de frequências de uma variável contínua

consideramos intervalos de mesmo comprimento para determinarmos suas frequências

relativas. Assim, seguimos o seguinte roteiro:

a – Achar o máximo e o mínimo dos dados

b – Escolher intervalos de mesmo comprimento que cubra a amplitude entre o mínimo e

o máximo. Esses intervalos são chamados de classes.

c – Contar o número de observações que pertencem a cada intervalo de classe. Esses

números são as frequências observadas das classes.

d – Calcular as frequências relativas (%) de cada classe:

sobservaçõe de totalnº

classe de observada frequência(%) FR

e – O número de classes é geralmente calculado por sobservaçõe de número k . O

número de classes deve estar entre 5 e 20, e o número que você escolher deve ser

influenciado pela conveniência de se usar números inteiros. Inclua todas as classes,

mesmo aquelas com frequência zero.

Observações:

1. Há situações em que a variável é por natureza discreta, mas o conjunto de

possíveis valores é muito grande. O caminho adequado, neste caso, é tratar a

variável como se fosse contínua e criar classes para representar seus valores.

2. Pode-se verificar tabelas de frequências com classes de tamanho desiguais.

Exemplo 4: Os dados abaixo representam os tempos de vida (em horas) de 40

componentes eletrônicos submetidos a um experimento num laboratório industrial.

3,20 11,70 13,64 15,60 15,89 28,44 29,07 37,44 41,81 43,35 43,94

49,51 49,82 51,20 51,43 52,47 53,72 53,92 54,03 56,89 63,80 66,40

68,64 70,15 70,98 74,52 76,68 77,84 80,91 84,04 85,70 86,48 88,92

Page 11: Apostila - Estatística1

11

89,28 91,36 91,62 98,79 102,39 104,21 124,27

Considerando intervalos de classes de comprimento 25, temos na Tabela 3 a

distribuição de frequências para esses dados.

Tabela 3: Distribuição de frequências da variável tempo de vida de

componentes eletrônicos.

Intervalo de classe Frequência F.R(%)

0|−25 5 12,50

25|−50 8 20,00

50|−75 13 32,50

75|−100 11 27,50

100|−125 3 7,50

Total 40 100,00

1.4 Séries Estatísticas

Série Estatística é toda tabela que apresenta a distribuição de um conjunto de

dados estatísticos em função da época, do local ou da espécie. Portanto, numa série

estatística, observamos a existência de 3 elementos: tempo, espaço e a espécie.

Conforme varie um dos elementos da série, podemos classificá-la em histórica

(ou cronológica) , geográfica(ou localização) e específica (ou categórica).

A série geográfica é feita para apresentar dados de diferentes regiões

geográficas, em determinado instante.

Tabela 4: Percentual de pessoas com 10 anos e mais que

declararam rendimento de até um salário mínimo, segundo as

grandes regiões do país.

Região Percentual

Brasil 25,3

Norte 32,8

Nordeste 48,0

Sudeste 16,0

Sul 18,8

Centro-Oeste 22,3

Fonte: Folha de São Paulo (2002).

Page 12: Apostila - Estatística1

12

A série cronológica é feita para apresentar dados observados ao longo do tempo,

em determinado local.

Tabela 5: Frango – preços médios em São Paulo – 2003-2008

Anos Preço Médio (R$)

2003 2,56

2004 2,64

2005 2,67

2006 2,53

2007 3,20

2008 3,64

Fonte: Associação Paulista de Avicultura.

A série categórica é feita para apresentar dados que se distribuem em diferentes

categorias, em determinado tempo e local.

Tabela 6: Rebanhos brasileiros – Efetivo nos

estabelecimentos agropecuários (2006)

Espécies Quantidade

Bovinos 205.886.244

Bubalinos 1.156.870

Aves 821.541.630

Suínos 35.173.824

Ovinos 16.019.170

Caprinos 10.401.449

Fonte: IBGE.

Muitas vezes temos necessidade de apresentar, em uma única tabela, a variação

de valores de mais de uma variável, isto é, fazer uma conjunção de duas ou mais séries.

Conjugando duas séries em uma única tabela, obtemos uma tabela de dupla

entrada. Em uma tabela desse tipo ficam criadas duas ordens de classificação: uma

horizontal (linha) e uma vertical (coluna).

Page 13: Apostila - Estatística1

13

Tabela 7: Taxas de analfabetismo de pessoas com 15 anos e

mais, segundo a cor, nos censos demográficos de 1991 e 2000.

Cor Censo 1991 Censo 2000

Brasil 19,4 12,9

Branca 11,9 8,3

Preta 31,5 21,5

Amarela 5,4 4,9

Parda 27,8 18,2

Indígena 50,8 26,1 Sem declaração 18,7 16,1

Fonte: Retrato do Brasil. Folha de São Paulo, São Paulo, 21

dez. 2002.

1.5 Dados absolutos e dados relativos

Dados absolutos: são dados resultantes da coleta direta da fonte, sem outra

manipulação senão a contagem ou medida.

Dados relativos: são o resultado de comparações por quocientes (razões) que se

estabelecem entre dados absolutos e têm por finalidade realçar ou facilitar as

comparações entre quantidades.

Os dados relativos traduzem-se, em geral, por meio de porcentagens, índices e

taxas.

Para exemplificar a importância das porcentagens na interpretação dos dados,

vamos considerar a seguinte série:

Tabela 8: População residente no Brasil, segundo o sexo, de

acordo com o censo demográfico de 2000.

Sexo População

residente

Percentual

Homens 83.576.015 49,22

Mulheres 86.223.155 50,78

Total 169.799.170 100,00

Fonte: IBGE (2003)

Com os valores da coluna do percentual podemos perceber que, de cada 100

brasileiros residentes no Brasil, 49 são do sexo masculino e aproximadamente 51 são do

sexo feminino.

Page 14: Apostila - Estatística1

14

O emprego da porcentagem é de grande valia quando o nosso intuito é destacar a

participação da parte no todo.

Agora, vamos analisar a série:

Tabela 9: Matrículas nas escolas das cidades A e B - 2008

Categorias Número de alunos

Cidade A Cidade B Ensino Fundamental 19.286 38.660

Ensino Médio 1.681 3.399 Ensino Superior 234 424

Total 21.201 42.483

Dados Fictícios

De acordo com as informações contidas na tabela, qual das cidades tem,

comparativamente, maior número de alunos em cada nível de ensino?

Como o número total de alunos é diferente nas duas cidades, não é fácil concluir

a respeito usando os dados absolutos. No entanto, usando as porcentagens, tal tarefa

fica bastante facilitada. Assim, acrescentando na tabela anterior as colunas

correspondentes às porcentagens, obtemos:

Tabela 10: Matrículas nas escolas das cidades A e B - 2008

Categorias Cidade A Cidade B

Nº de alunos % Nº de alunos % Ensino Fundamental 19.286 90,97 38.660 91,00

Ensino Médio 1.681 7,93 3.399 8,00 Ensino Superior 234 1,10 424 1,00

Total 21.201 100,00 42.483 100,00

Dados Fictícios

o que nos permite dizer que, comparativamente, as cidades contam, praticamente, com o

mesmo número de alunos em cada nível de ensino.

Page 15: Apostila - Estatística1

15

Além das porcentagens, nos deparamos com muitas informações na mídia a

respeito de razões, índices, taxas, pontos percentuais e variações percentuais. Agora,

vamos definir cada um destes conceitos.

1.5.1 Razões

Razão é uma relação entre duas grandezas. Para obter a razão entre a e b, basta

dividir a por b.

b

arazão

Quando comparamos grandezas da mesma espécie, expressamos a razão na

forma de fração irredutível. Quando comparamos grandezas diferentes, em geral,

dividimos e representamos o quociente na forma de número decimal.

Por exemplo, numa sala com 25 meninos e 15 meninas, podemos afirmar que a

razão entre o número de meninos e meninas é 3

5

15

25 , ou seja, para cada 3 meninas, há

5 meninos na sala.

Agora, suponha que um automóvel percorra a distância de São Paulo a Belo

Horizonte em 6,5 horas. Como a distância entre as duas cidades é de 586 km, temos

que a velocidade média é de, aproximadamente, 90,15km/h.

1.5.2 Índices

Os índices são razões entre duas grandezas tais que uma não inclui a outra.

Exemplos de índices:

superfície

população ademográfic Densidade

Page 16: Apostila - Estatística1

16

Índices econômicos:

população

bem do consumo Consumo capitaper

população

renda Renda capitaper

1.5.3 Taxas

A taxa também é uma relação entre duas grandezas, mas, neste caso,o

numerador faz parte do denominador, ou seja, o denominador contém o numerador.

Para obter uma taxa, dividimos a por a + b. O resultado pode ser multiplicado por 100,

ou por 1.000 ou 10.000.

São exemplos de taxas:

000.1período e local mesmo do população

período e local dado em óbitos de númeroemortalidad de Taxa

000.1período e local mesmo do população

período e local dado em vivosnascidos de númeronatalidade de Taxa

100matrículas de inicial número

evadidos alunos de númeroescolar evasão de Taxa

1.5.4 Variações percentuais e Pontos percentuais

Se Q1 e Q2 são duas grandezas quaisquer medidas na mesma unidade, tomando

Q1 como base de comparação, temos a seguinte definição para variação percentual:

Page 17: Apostila - Estatística1

17

100Q

QQ V

1

12

Ou

1001Q

Q V

1

2

A noção de "pontos percentuais", atualmente, é bastante empregada nos meios

de comunicação de massa e pelos economistas brasileiros. Vamos explicar seu

significado através de alguns exemplos:

Se a inflação subiu de 8% para 10%, podemos tanto dizer que houve um

aumento de 25% na inflação como dizer que a inflação subiu dois pontos

percentuais.

Se determinado imposto subiu de 3% para 5%, é a mesma coisa dizer que o

aumento foi de 40% e dizer que o imposto subiu dois pontos percentuais.

Se a taxa de juros passou de 20% para 50%, esse aumento pode ser descrito

como sendo um aumento de 150% ou como sendo um aumento de trinta pontos

percentuais.

1.6 Gráficos

A organização dos dados em tabelas de frequências proporciona um meio eficaz

de estudo do comportamento das características de interesse. Muitas vezes, as

informações contidas nas tabelas podem ser mais facilmente visualizadas através de

gráficos. Existem vários tipos de representação gráfica, mas vamos abordar aqui os mais

simples para variáveis qualitativas e quantitativas.

Antes de comentarmos especificamente sobre alguns deles, vale ressaltar a

importância de se interpretar corretamente um gráfico. Devemos analisar a informação

Page 18: Apostila - Estatística1

18

numérica fornecida no gráfico, de modo a não nos enganarmos por sua forma geral. Por

exemplo, vamos analisar os seguintes gráficos:

Figura 1.1: Gráficos em colunas para a variável PIB municipal

Fonte: http://veja.abril.com.br/noticia/brasil/pesquisa-do-ibge-faz-uma-radiografia-da-

riqueza-dos-municipios

Os dois gráficos retratam os mesmos dados, mas o segundo é feito de modo a

exagerar a diferença entre o PIB no Rio de Janeiro e em Brasília. Pelo fato de não

iniciar o eixo vertical em zero, o segundo gráfico tende a produzir uma impressão

subjetiva enganosa, levando o leitor a acreditar que a diferença seja muito maior do que

realmente é.

154,7

117,5

0

50

100

150

200

Rio de Janeiro Brasília PIB

mu

nic

ipal

de

20

08

(e

m

bilh

õe

s d

e r

eai

s)

Municípios

154,7

117,5

100

120

140

160

Rio de Janeiro Brasília

PIB

mu

nic

ipal

de

20

08

(e

m

bilh

õe

s d

e r

eai

s)

Municípios

Page 19: Apostila - Estatística1

19

1.6.1 Gráfico em Linhas

Quando os dados estiverem distribuídos segundo uma variável no tempo (meses,

anos, etc.), podemos representá-los através de um gráfico em linhas. Esse tipo de

gráfico retrata as mudanças nas quantidades com respeito ao tempo (série temporal)

através de uma série de segmentos de reta. É muito eficiente para mostrar possíveis

tendências no conjunto de dados.

Figura 1.2: Gráfico em linha para dados de assinantes de telefones celulares.

1.6.2 Gráfico (ou Diagrama) em Barras (ou Colunas)

Os diagramas em barras (ou colunas) são bastante utilizados quando trabalhamos

com variáveis qualitativas (dados categóricos) ou quantitativas discretas. No eixo

horizontal especificamos os nomes das categorias e no eixo vertical construímos uma

escala com a frequência ou a frequência relativa. As barras terão bases de mesma

largura e alturas iguais à frequência ou à frequência relativa. O gráfico em barras,

quando as barras estão dispostas no sentido vertical, também é chamado de gráfico em

colunas.

1,1 1,3 1,5 1,9 2,4 2,6

3,1

7,4

18,6

21,5

29

0

5

10

15

20

25

30

35

1996 1998 2000 2002 2004 2006 2008

Ass

inan

tes

(em

milh

õe

s)

Anos

Page 20: Apostila - Estatística1

20

Figura 1.3: Gráfico em colunas para a variável desempenho do professor

Figura 1.4: Gráfico em barras para a variável desempenho do professor

Figura 1.5: Gráfico em colunas para a variável número de filhos

0

20

40

60

80

100

120

140

160

Bom Regular Péssimo

Fre

qu

ên

cia

Desempenho do professor

0 50 100 150 200

Bom

Regular

Péssimo

Frequência

De

sem

pe

nh

o d

o p

rofe

sso

r

0

2

4

6

8

10

12

14

0 1 2 3 4 5 6

Fre

qu

ên

cia

Número de filhos

Page 21: Apostila - Estatística1

21

1.6.3 Diagrama de Pareto

Quando construímos o gráfico de barras para variáveis qualitativas e as barras

são arranjadas em ordem descendente de altura, a partir da esquerda para a direita, com

o atributo que ocorre com maior frequência aparecendo em primeiro lugar,

denominamos este gráfico de barras de Diagrama de Pareto.

A grande utilidade deste diagrama é a de permitir uma fácil visualização e

identificação das causas ou problemas mais importantes, possibilitando a concentração

de esforços sobre os mesmos. O diagrama de Pareto é uma das sete ferramentas da

qualidade.

Exemplo 5: Uma indústria de computador preocupada com vários defeitos que um de

seus produtos vem apresentando, fez um levantamento e constatou os seguintes

problemas:

A : Defeito na cobertura plástica.

B : Defeito no teclado.

C : Defeito na fonte de energia.

D : Soldas soltas.

E : Defeito na placa da unidade de processamento.

F : Defeito no visor.

G : Outros.

As frequências para cada problema estão apresentadas na Tabela 11. Vamos

apresentar as informações da tabela no diagrama de Pareto.

Page 22: Apostila - Estatística1

22

Tabela 11: Tipos de problemas numa indústria de

computadores.

Tipo de

problema

Frequência F.R.(%)

D 80 38,65

C 55 26,57

E 32 15,46

B 20 9,66

A 10 4,83

G 7 3,38 F 3 1,45

Total 207 100,00

A Figura 1.6 apresenta o diagrama de Pareto para este conjunto de dados.

Figura 1.6: Diagrama de Pareto.

1.6.3 Gráfico (ou Diagrama) em Setores

O diagrama em setores, também conhecido como gráfico de pizza, é um dos

gráficos mais utilizados para representar variáveis qualitativas (ou categóricas) e é

0

10

20

30

40

50

60

70

80

90

D C E B A G F

Fre

qu

ên

cia

Tipos de Problemas

Page 23: Apostila - Estatística1

23

bastante apropriado quando se deseja visualizar a proporção que cada categoria

representa do total.

Figura 1.7: Gráfico circular para a variável desempenho do professor

1.6.4 Histograma e Polígono de Frequência

Quando os dados estiverem agrupados em intervalos de classe, o gráfico que

construímos é o histograma. Os histogramas são representações gráficas das

distribuições de frequências dadas por retângulos. Cada retângulo do histograma tem

largura igual a cada intervalo de classe e altura dada pela frequência absoluta ou

relativa.

Figura 1.8: Histograma para a variável tempo de vida de componentes eletrônicos.

54,29% 27,50%

18,21%

Bom

Regular

Péssimo

0

2

4

6

8

10

12

14

12,5 37,5 62,5 87,5 112,5

Fre

qu

ên

cia

tempo de vida (horas)

Page 24: Apostila - Estatística1

24

O polígono de frequência é outro gráfico que ilustra uma distribuição de

freqüência aparentando uma poligonal, que é o resultado da interligação de pontos que

representam as freqüências em cada classe.

Cada classe é representada na linha de base pelo seu ponto médio que é o ponto

central de uma classe.

A preparação de um quadro para o polígono de freqüência obedece a mesma

técnica do histograma, variando apenas quanto à representação das classes pelo ponto

médio.

Histograma e polígono de freqüência salientam um fenômeno de maneira

idêntica, tanto assim é que, construindo ambos em um mesmo sistema de coordenadas,

vamos verificar sua perfeita sobreposição.

Figura 1.9: Histograma para a variável tempo de vida de componentes eletrônicos.

0

5

8

13

11

3

0 0

2

4

6

8

10

12

14

0 12,5 37,5 62,5 87,5 112,5 137,5

Fre

qu

ên

cia

tempo de vida (horas)