55
Ana Lúcia Guimarães Carvalho ESTATÍSTICA 1 ESTATÍSTICA BÁSICA Podemos dividi-la em duas: Estatística descritiva, que apenas descreve e analisa um conjunto de dados, sem tirar conclusões; e Estatística indutiva ou Inferência Estatística, que trata das inferências e conclusões, isto é, a partir da análise de dados são tiradas conclusões. MÉTODO CIENTÍFICO Método científico é um conjunto de meios dispostos convenientemente para se chegar a um fim que se deseja. Dos métodos científicos, vamos destacar o método experimental e o estatístico. Método Experimental O Método experimental consiste em manter constante todas as causas (fatores), menos uma, e variar esta causa de modo que o pesquisador possa descobrir seus efeitos, caso existam. É o método preferido no estudo da Física, da Química etc. Método Estatístico Muitas vezes temos necessidade de descobrir fatos em um campo em que o método experimental não se aplica (nas ciências sociais), já que os vários fatores que afetam o fenômeno em estudo não podem permanecer constantes enquanto fazemos variar a causa que, naquele momento, nos interessa. Nesses casos, lançamos mão do método estatístico. O método estatístico, diante da impossibilidade de manter as causas constantes, admite todas essas causas presentes variando-as, registrando essas variações e procurando determinar, no resultado final, que influências cabem a cada uma delas. Fases do Método Estatístico Podemos distinguir no método estatístico as seguintes fases: 1. Planejamento Consiste em determinar quais são os dados a serem levantados e como estes serão levantados, fazendo uma análise de material e custos necessários durante a pesquisa. 2. Coleta de dados Após cuidadoso planejamento, damos início à coleta de dados. A coleta pode ser direta e indireta. A coleta é direta quando os dados são coletados diretamente na fonte. A coleta direta de dados pode ser classificada relativamente ao fator tempo em; a. contínua (registro) quando feita continuamente, tal como a de nascimentos e óbitos e a de freqüência dos alunos às aulas; b. periódica - quando feita em intervalos constantes de tempo, como os censos (de 10 em 10 anos) e as avaliações mensais dos alunos; c. ocasional quando feita extemporaneamente, a fim de atender a uma conjuntura ou a uma emergência, como no caso de epidemias que assolam ou dizimam rebanhos inteiros. A coleta pode ser indireta quando os dados são levantados em órgãos que já tenham efetuado a pesquisa de campo. Como exemplo, podemos citar a pesquisa sobre a mortalidade infantil, que é feita através de dados colhidos por uma coleta direta. 3. Crítica dos dados Obtidos os dados, eles devem ser cuidadosamente criticados, à procura de possíveis falhas e imperfeições, a fim de não incorrermos em erros grosseiros ou de certo A Estatística é a parte da Matemática Aplicada que trata dos métodos científicos para coleta, organização, resumo, apresentação e análise de dados.

Apostila de Estatística Básica

Embed Size (px)

DESCRIPTION

Apostila de Estatística Básica para cursos de ensino médio e técnico em contabilidade.

Citation preview

Page 1: Apostila de Estatística Básica

Ana Lúcia Guimarães Carvalho

ESTATÍSTICA 1

ESTATÍSTICA BÁSICA

Podemos dividi-la em duas: Estatística descritiva, que apenas descreve e analisa um conjunto de dados, sem tirar conclusões; e Estatística indutiva ou Inferência Estatística, que trata das inferências e conclusões, isto é, a partir da análise de dados são tiradas conclusões. MÉTODO CIENTÍFICO Método científico é um conjunto de meios dispostos convenientemente para se chegar a um fim que se deseja. Dos métodos científicos, vamos destacar o método experimental e o estatístico. Método Experimental O Método experimental consiste em manter constante todas as causas (fatores), menos uma, e variar esta causa de modo que o pesquisador possa descobrir seus efeitos, caso existam. É o método preferido no estudo da Física, da Química etc. Método Estatístico Muitas vezes temos necessidade de descobrir fatos em um campo em que o método experimental não se aplica (nas ciências sociais), já que os vários fatores que afetam o fenômeno em estudo não podem permanecer constantes enquanto fazemos variar a causa que, naquele momento, nos interessa. Nesses casos, lançamos mão do método estatístico. O método estatístico, diante da impossibilidade de manter as causas constantes, admite todas essas causas presentes variando-as, registrando essas variações e procurando determinar, no

resultado final, que influências cabem a cada uma delas. Fases do Método Estatístico Podemos distinguir no método estatístico as seguintes fases: 1. Planejamento Consiste em determinar quais são os dados a serem levantados e como estes serão levantados, fazendo uma análise de material e custos necessários durante a pesquisa. 2. Coleta de dados Após cuidadoso planejamento, damos início à coleta de dados. A coleta pode ser direta e indireta. A coleta é direta quando os dados são coletados diretamente na fonte. A coleta direta de dados pode ser classificada relativamente ao fator tempo em;

a. contínua (registro) – quando feita continuamente, tal como a de nascimentos e óbitos e a de freqüência dos alunos às aulas;

b. periódica - quando feita em intervalos constantes de tempo, como os censos (de 10 em 10 anos) e as avaliações mensais dos alunos;

c. ocasional – quando feita extemporaneamente, a fim de atender a uma conjuntura ou a uma emergência, como no caso de epidemias que assolam ou dizimam rebanhos inteiros.

A coleta pode ser indireta quando os

dados são levantados em órgãos que já tenham efetuado a pesquisa de campo. Como exemplo, podemos citar a pesquisa sobre a mortalidade infantil, que é feita através de dados colhidos por uma coleta direta. 3. Crítica dos dados Obtidos os dados, eles devem ser cuidadosamente criticados, à procura de possíveis falhas e imperfeições, a fim de não incorrermos em erros grosseiros ou de certo

A Estatística é a parte da Matemática Aplicada que trata dos métodos científicos para coleta, organização, resumo, apresentação e análise de dados.

Page 2: Apostila de Estatística Básica

Ana Lúcia Guimarães Carvalho

ESTATÍSTICA 2

vulto, que possam influir sensivelmente nos resultados. 4. Apuração dos dados É a soma e o processamento dos dados obtidos e a disposição mediante critérios de classificação. 5. Exposição ou apresentação dos dados Por mais diversa que seja a finalidade que se tenha em vista, os dados devem ser apresentados sob forma adequada (tabelas ou gráficos), tornando mais fácil o exame daquilo que está sendo objeto de tratamento estatístico. 6. Análise dos resultados É o objetivo último da Estatística que consiste em tirar conclusões sobre o todo (população) a partir de informações fornecidas por parte representativa do todo (amostra).Assim, fazemos uma análise dos resultados obtidos e tiramos desses resultados conclusões e previsões. 7. Conclusão Significado matemático da pesquisa, podendo apresentar comentários e críticas aos resultados. Exercícios: 1) Defina Estatística e exemplifique a sua

utilização. 2) Defina método científico. 3) Cite e explique detalhadamente as fases do

método estatístico. POPULAÇÃO E AMOSTRA Variáveis A cada fenômeno corresponde um número de resultados possíveis. Assim, por exemplo: - para o fenômeno “sexo”são dois os

resultados possíveis: sexo masculino e sexo feminino;

- para o fenômeno “número de filhos”há um número de resultados possíveis expresso através dos números naturais: 0, 1, 2, 3, ...,n;

- para o fenômeno “estatura”temos uma situação diferente, pois os resultados podem tomar um número infinito de valores numéricos dentro de um determinado intervalo.

Variável é, convencionalmente, o conjunto de resultados possíveis de um fenômeno. Os exemplos nos dizem que uma variável pode ser: a. qualitativa – quando seus valores são

expressos por atributos: sexo (masculino-feminino), cor da pele (branca, preta, amarela, vermelha, parda) etc.;

b. quantitativa – quando seus valores são expressos em números (salários dos operários, idade dos alunos de uma escola etc.). Uma variável quantitativa que pode assumir, teoricamente, qualquer valor entre dois limites recebe o nome de variável contínua (exemplos: peso dos alunos de uma escola) ; uma variável que só pode assumir valores pertencentes a um conjunto enumerável recebe o nome de variável discreta ( exemplos: número de alunos de uma escola). De modo geral, as medições dão origem a variáveis contínuas e as contagens ou enumerações, a variáveis discretas.

Exercícios: 1) Classifique as variáveis em qualitativas ou

quantitativas (contínuas ou descontínuas): a) Universo: alunos de uma escola. Variável: cor dos cabelos – b) Universo: casais residentes em uma cidade. Variável: número de filhos – c) Universo: as jogadas de um dado. Variável: o ponto obtido em cada jogada – d)Universo: peças produzidas por certa

máquina. Variável: número de peças produzidas por

hora

Page 3: Apostila de Estatística Básica

Ana Lúcia Guimarães Carvalho

ESTATÍSTICA 3

e) Universo: peças produzidas por certa máquina

Variável: diâmetro externo – 2) Diga quais das variáveis abaixo são

discretas e quais são contínuas: a) População: alunos de uma cidade. Variável: cor dos olhos. b) P.: estação meteorológica de uma cidade. V.: precipitação pluviométrica, durante um

ano. c) P.: Bolsa de Valores de São Paulo. V.: número de ações negociadas. d) P.: pregos produzidos por uma máquina. V.: comprimento. e) P.: casais residentes em uma cidade. V.: sexo dos filhos. f) P.: bibliotecas da cidade de São Paulo. V.: número de volumes. 3) Como se separa as variáveis em discretas e

contínuas? Dê pelo menos, três exemplos de cada tipo de variáveis.

População Ao conjunto de entes portadores de, pelo menos, uma característica comum denominamos população estatística ou universo estatístico. Assim, os estudantes, por exemplo, constituem uma população, pois apresentam pelo menos uma característica comum: são os que estudam. Amostra Na maioria das vezes, por impossibilidade ou inviabilidade econômica ou temporal, limitamos as observações referentes a uma determinada pesquisa a apenas uma parte da população. A essa parte proveniente da população em estudo denominamos amostra. Uma amostra é um subconjunto finito de uma população. Para as inferências serem corretas, é necessário garantir que a amostra seja representativa da população, isto é, a amostra deve possuir as mesmas características básicas da população, no que diz respeito ao

fenômeno que desejamos pesquisar. É preciso, pois, que a amostra ou as amostras que vão ser usadas sejam obtidas por processos adequados. Amostragem Consiste em uma técnica especial para recolher amostras, que garante, tanto quanto possível, o acaso na escolha. Dessa forma, cada elemento da população passa a ter a mesma chance de ser escolhido, o que garante à amostra o caráter de representatividade, e isto é muito importante, pois nossas conclusões relativas à população vão estar baseadas nos resultados obtidos nas amostras dessa população. Principais técnicas de amostragem: 1- Amostragem casual ou aleatória simples Este tipo de amostragem é equivalente a um sorteio lotérico. Na prática, a amostragem casual ou aleatória simples pode ser realizada numerando-se a população de 1 a n e sorteando-se, a seguir, por meio de um dispositivo aleatório qualquer, k números dessa seqüência, os quais corresponderão aos elementos pertencentes à amostra. Exemplo: Vamos obter uma amostra representativa para a pesquisa da estatura de noventa alunos de uma escola:

a. Numeramos os alunos de 01 a 90. b. Escrevemos os números, de 01 a 90, em

pedaços iguais de um mesmo papel, colocando-os dentro de uma caixa. Agitamos sempre a caixa para misturar bem os pedaços de papel e retiramos, um a um, nove números que formarão a amostra. Neste caso, 10% da população.

Quando o número de elementos da amostra é grande, esse tipo de sorteio torna-se muito trabalhoso. A fim de facilita-lo, foi elaborada uma tabela – Tabela de Números Aleatórios -, construída de modo que os dez algarismos (0 a 9) são distribuídos ao acaso nas linhas e colunas (Anexo I) Para obtermos os elementos da amostra usando a tabela, sorteamos um algarismo qualquer da mesma, a partir do qual iremos

Page 4: Apostila de Estatística Básica

Ana Lúcia Guimarães Carvalho

ESTATÍSTICA 4

considerar números de dois, três ou mais algarismos, conforme nossa necessidade. Os números assim obtidos irão indicar os elementos da amostra. A leitura da tabela pode ser feita horizontalmente (da direita para a esquerda ou vice-versa), verticalmente ( de cima para baixo ou vice-versa), diagonalmente (no sentido ascendente ou descendente) ou formando desenhos de uma letra qualquer. A opção, porém, deve ser feita antes de iniciado o processo. 2 – Amostragem proporcional estratificada Muitas vezes a população se divide em subpopulações – estratos. Como é provável que a variável em estudo apresente, de estratos em estratos, um comportamento heterogêneo e, dentro de cada estrato, um comportamento homogêneo, convém que o sorteio dos elementos da amostra leve em consideração tais estratos. É exatamente isso que fazemos quando empregamos a amostragem proporcional estratificada, que, além de considerar a existência dos estratos, obtém os elementos da amostra proporcional ao número de elementos dos mesmos. Exemplo: Supondo, no exemplo anterior, que, dos noventa alunos, 54 sejam meninos e 36 sejam meninas, vamos obter a amostra proporcional estratificada. São, portanto, dois estratos (sexo masculino e sexo feminino) e queremos uma amostra de 10% da população. Logo, temos: SEXO POPUL. 10% AMOSTRA

M

F

54

36

4,5100

5410=

×

6,3100

3610=

×

5

4

TOTAL

90

0,9100

9010=

×

9

Numeramos os alunos de 01 a 90, sendo que de 01 a 54 correspondem meninos e de

55 a 90, meninas. Usando a tabela de números aleatórios retiramos os elementos da população. 3 – Amostragem sistemática Quando os elementos da população já se acham ordenados, não há necessidade de construir o sistema de referência. São exemplos os prédios de uma rua, as linhas de produção etc. Nestes casos, a seleção dos elementos que constituirão a amostra pode ser feita por um sistema imposto pelo pesquisador. A esse tipo de amostragem denominamos sistemática. Exemplo: No caso de uma linha de produção, podemos, a cada dez itens produzidos, retirar um para pertencer a uma amostra da população diária. Neste caso, estaríamos fixando o tamanho da amostra em 10% da população. Exercícios: 1) Descreva as técnicas de amostragens.

Quando se utiliza cada uma delas? 2) O que é população estatística?

3) O que é amostra?

4) O que é amostragem?

5) O diretor de uma escola, na qual estão

matriculados 280 meninos e 320 meninas, desejoso de conhecer as condições de vida extra-escolar de seus alunos e não dispondo de tempo para entrevistar todas as famílias, resolveu fazer um levantamento, por amostragem, em 10% dessa clientela. Obtenha, para esse diretor, os elementos componentes da amostra.

Page 5: Apostila de Estatística Básica

Ana Lúcia Guimarães Carvalho

ESTATÍSTICA 5

6) Uma cidade X apresenta o seguinte

quadro relativo às suas escolas de 1º grau:

Nº DE ESTUDANTES ESCOLAS

MASCULINO FEMININO A B C D E F

80 102 110 134 150 300

95 120 92

228 130 290

Total 876 955

Obtenha uma amostra proporcional estratificada de 120 estudantes. 7) Em uma escola existem 250 alunos, sendo

35 na 1ª série, 32 na 2ª, 30 na 3ª, 28 na 4ª, 35 na 5ª, 32 na 6ª, 31 na 7ª e 27 na 8ª. Obtenha uma amostra de 40 alunos e preencha o quadro seguinte.

Série População Cálculo

Proporcional Amostra

Total 250 40

SÉRIES ESTATÍSTICAS Um dos objetivos da Estatística é sintetizar os valores que uma ou mais variáveis podem assumir, para que tenhamos uma visão global da variação dessa ou dessas variáveis. E isto ela consegue, inicialmente, apresentando esses valores em tabelas e gráficos, que irão nos fornecer rápidas e seguras informações a respeito das variáveis em estudo, permitindo-nos determinações administrativas e pedagógicas mais coerentes e científicas. Tabela

Tabela é um quadro que resume um conjunto de observações. Uma tabela compõe-se de:

a. corpo – conjunto de linhas e colunas que contêm informações sobre a variável em estudo;

b. cabeçalho – parte superior da tabela que especifica o conteúdo das colunas;

c. coluna indicadora – parte da tabela que especifica o conteúdo das linhas;

d. linhas – retas imaginárias que facilitam a leitura, no sentido horizontal, de dados que se inscrevem nos seus cruzamentos com as colunas;

e. casa ou célula – espaço destinado a um só número;

f. título – conjunto de informações, as mais completas possíveis, localizado no topo da tabela;

g. rodapé – são os elementos complementares da tabela, tais como fonte, as notas e as chamadas, colocados, de preferência, no fecho da tabela.

Exemplo:

PRODUÇÃO DE CAFÉ

BRASIL – 1996-2000 ANOS PRODUÇÃO

(1.000 t)

1996 1997 1998 1999 2000

2.535 2.666 2.122 3.750 2.007

FONTE: Dados Hipotéticos

Séries Estatísticas Denominamos série estatística toda tabela que apresenta a distribuição de um conjunto de dados estatísticos em função da época, do local ou da série. Daí podemos concluir que numa série estatística observamos a existência de três elementos ou fatores: o tempo, o espaço e a espécie.

Cabeçalho

Coluna Indicadora

Corpo

Rodapé

Cabeçalho

Coluna Numérica

Casa ou Célula

Linhas

Título

Page 6: Apostila de Estatística Básica

Ana Lúcia Guimarães Carvalho

ESTATÍSTICA 6

Conforme varie um dos elementos da série, podemos classifica-la em histórica, geográfica e específica. Séries históricas Descrevem os valores da variável, em determinado local, descriminados segundo intervalos de tempo variáveis. Exemplo:

PRODUÇÃO DE FERTILIZANTES FOSFATADOS – BRASIL

1995 – 1999 ANOS QUANTIDADE

(t) 1995 1996 1997 1998 1999

3.570.115 4.504.201 5.448.835 4.373.226 4.024.813

Fonte: Dados Hipotéticos

Séries Geográficas Descrevem os valores da variável, em determinado instante, discriminados segundo regiões. Exemplo:

PRODUÇÃO DE OVOS DE GALINHA NO BRASIL – 2000

REGIÃO QUANTIDADE (1.000 dúzias)

Norte Nordeste Sudeste

Sul Centro-Oeste

66.092 356.810 937.463 485.098 118.468

Fonte: Dados hipotéticos

Séries Específicas Descrevem os valores da variável, em determinado tempo e local, discriminados segundo especificações ou categorias. Exemplo:

REBANHOS BRASILEIROS 2000

ESPÉCIE QUANTIDADE (1.000 cabeças)

Bovinos Eqüinos

Suínos Ovinos

Caprinos Coelhos

139.599 5.855 32.121 20.085 11.313 909

Fonte: Dados hipotéticos

Séries Conjugadas – Tabela de Dupla Entrada Muitas vezes temos necessidade de apresentar, em uma única tabela, a variação de valores de mais de uma variável, isto é, fazer uma conjugação de duas ou mais séries. Conjugando duas séries em uma única tabela, obtemos uma tabela de dupla entrada. Em uma tabela desse tipo ficam criadas duas ordens de classificação: uma horizontal (linha) e uma vertical (coluna). Exemplo:

TELEFONES INSTALADOS – 1997-99 REGIÃO 1997 1998 1999

Norte

Nordeste

Sudeste

Sul

Centro-Oeste

373.312

1.440.531

8.435.308

2.106.145

803.013

403.712

1.567.006

8.892.409

2.192.762

849.401

457.741

1.700.467

8.673.660

2.283.581

944.075

Total 13.158.309 13.905.290 14.059.524

Fonte: Dados Hipotéticos A conjugação, no exemplo dado, foi série geográfico-histórica. Exercícios

1) Classifique as séries a) PRODUÇÃO BRASILEIRA DE

CARVÃO MINERAL BRUTO 1998-00 ANO QUANTIDADE

PRODUZIDA (1.000 t)

1998 1999 2000

22.700 18.115 20.984

Fonte: Dados Hipotéticos

Page 7: Apostila de Estatística Básica

Ana Lúcia Guimarães Carvalho

ESTATÍSTICA 7

b) AVICULTURA BRASILEIRA - 1999 ESPÉCIE NÚMERO

(1.000 cabeças) Galinhas

Patos, marrecos e gansos

Perus

511.834

5.888

3.823

Fonte: Dados Hipotéticos c) CRIANÇAS NÃO-VACINADAS CONTRA A PÓLIO - 1999

REGIÕES QUANTIDADE Nordeste Sudeste Norte Centro-Oeste Sul

512.900 299.585 148.818 124.791 105.371

Total 1.191.465

Dados fictícios d)

AQUECIMENTO DE UM MOTOR DE AVIÃO DE MARCA X

MINUTOS TEMPERATURA (º C)

0 1 2 3 4 5 6

20 27 34 41 49 56 63

Dados Fictícios e) PRODUÇÃO DE LAMINADOS NÃO-PLANOS - BRASIL - 1998-2000

QUANTIDADE (1.000 t) TIPOS 1998 1999 2000

Barras Vergalhões Perfilados Tubos

1.414 2.203 526 390

1.272 2.140 538 344

1.139 2.209 425 330

Dados Fictícios f) PESSOAL DOCENTE DO ESTADO DE SÃO PAULO - 1999

REDES 1º GRAU 2º GRAU Estadual Municipal Particular

171.910 18.429 31.514

38.281 1.304 19.902

Total 221.853 59.487

Dados hipotéticos 2)(Enem)A tabela abaixo apresenta dados

referentes à mortalidade infantil, à

porcentagem de famílias de baixa renda com crianças menores de 6 anos e às taxas de analfabetismo das diferentes regiões brasileiras e do Brasil como um todo.

Regiões

do Brasil

Mortalidade infantil*

Famílias de baixa renda

com crianças

menores de 6 anos (em

%)

Taxa de analfabetismo em maiores de 15 anos

(em %)

Norte 35,6 34,5 12,7 Nordeste 59,0 54,9 29,4 Sul 22,5 22,4 8,3 Sudeste 25,2 18,9 8,6 Centro-Oeste

25,4 25,5 12,4

Brasil 36,7 31,8 14,7 Fonte: Folha de S. Paulo, 11/3/99 * A mortalidade infantil indica o número de crianças que morrem antes de completar um ano de idade para cada grupo de 1.000 crianças que nasceram vivas.

Suponha que um grupo de alunos recebeu a tarefa de pesquisar fatores que interferem na manutenção da saúde ou no desenvolvimento de doenças. O primeiro grupo deveria colher dados que apoiasses a idéia de que, se combatendo agentes biológicos e químicos, garante-se a saúde. Já o segundo grupo deveria coletar informações que reforçassem a idéia de que a saúde de um indivíduo está diretamente relacionada à sua condição socioeconômica. Os dados da tabela podem ser utilizados apropriadamente para: a) apoiar apenas a argumentação do primeiro

grupo. b) apoiar apenas a argumentação do segundo

grupo. c) refutar apenas a posição a ser defendida

pelo segundo grupo. d) apoiar a argumentação dos dois grupos. e) refutar as posições a serem defendidas

pelos dois grupos. 3)(Enem)Lâmpadas incandescentes são

normalmente projetadas para trabalhar com a tensão da rede elétrica em que serão ligadas. Em 1997, contudo, lâmpadas projetadas para funcionar com 127 V foram retiradas do mercado e, em seu lugar, colocaram-se lâmpadas concebidas para uma tensão de 120 V. Segundo dados recentes, essa substituição representou uma mudança significativa no consumo de

Page 8: Apostila de Estatística Básica

Ana Lúcia Guimarães Carvalho

ESTATÍSTICA 8

energia elétrica para cerca de 80 milhões de brasileiros que residem nas regiões em que a tensão da rede é de 127 V.

A tabela abaixo apresenta algumas características de duas lâmpadas de 60 W, projetadas respectivamente para 127 V (antiga) e 120 V (nova), quando ambas se encontram ligadas numa rede de 127 V.

Lâmpada (projeto original)

Tensão da rede elétrica

Potência medida (watt)

Lumino sidade medida

(lúmens)

Vida útil

média (horas)

60 W – 127 V 127 V 60 750 1.000

60 W – 120 V 127 V 65 920 452

Acender uma lâmpada de 60 W e 120 V em um local onde a tensão na tomada é de 127 V, comparativamente a uma lâmpada de 60 W e 127 V no mesmo local, tem como resultado: a) mesma potência, maior intensidade de luz e

maior durabilidade. b) mesma potência, maior intensidade de luz e

menor durabilidade. c) maior potência, maior intensidade deluz e

maior durabilidade. d) maior potência, maior intensidade de luz e

menor durabilidade. e) menor potência, menor intensidade de luz e

menor durabilidade. GRÁFICOS ESTATÍSTICOS O gráfico estatístico é uma forma de apresentação dos dados estatísticos, cujo objetivo é o de produzir, no investigador ou no público em geral, uma impressão mais rápida e viva do fenômeno em estudo, já que os gráficos falam mais rápido à compreensão que as séries.

Para tornarmos possível uma representação gráfica, estabelecemos uma correspondência entre os termos da série e determinada figura geométrica, de tal modo que cada elemento da série seja representado por uma figura proporcional. A representação gráfica de um fenômeno deve obedecer a certos requisitos fundamentais, para ser realmente útil:

a) Simplicidade – o gráfico deve ser destituído de detalhes de importância

secundária, assim como de traços desnecessários que possam levar o observador a uma análise morosa ou com erros.

b) Clareza – o gráfico deve possibilitar uma correta interpretação dos valores representativos do fenômeno em estudo.

c) Veracidade – o gráfico deve expressar a verdade sobre o fenômeno em estudo.

Os principais tipos de gráficos são os diagramas, os cartogramas e os pictogramas. DIAGRAMAS Os diagramas são gráficos geométricos de, no máximo, duas dimensões; para sua construção, em geral, fazemos uso do sistema cartesiano. Dentre os principais diagramas, destacamos: Gráfico em linha ou em curva; Gráfico em coluna ou em barras; Gráfico em colunas ou em barras múltiplas; Gráfico em setores. Gráfico em linha ou em curva Os dados, geralmente de uma série (tabela), são colocados num sistema cartesiano ortogonal. Graficamente, temos pontos ligados por segmentos de reta. Exemplos: a)

VENDA DE TRATORES DE UMA FÁBRICA - 2000

Mês Unidades vendidas

Janeiro 20

Fevereiro 12

Março 16

Abril 24

Maio 8

Junho 18

Dados fictícios

Page 9: Apostila de Estatística Básica

Ana Lúcia Guimarães Carvalho

ESTATÍSTICA 9

0

4

8

12

16

20

24

J F M A M J

ve

nd

as

mês

b) DESEMPENHO DOS CANDIDATOS 1º SEMESTRE - 2001

Desempenho (%)

Candidatos

Mês A B C

Janeiro 12 30 40

Fevereiro 16 25 36

Março 20 20 40

Abril 24 18 32

Maio 30 20 35

Dados fictícios

0

5

10

15

20

25

30

35

40

45

J F M A M

A

B

C

De

se

mp

en

ho

(%

)

Mês

Exercícios Construa o gráfico de linhas para as tabelas a seguir: a) VENDA DE AUTOMÓVEIS 1º SEMESTRE 2001

Mês Unidades vendidas

Janeiro 12

Fevereiro 20

Março 18

Abril 24

Maio 16

Junho 8

Dados hipotéticos

b) PRONTO SOCORRO – CASOS

Dias da semana Atendimento

Segunda 12

Terça 20

Quarta 18

Quinta 24

Sexta 16

Sábado 8

Dados fictícios c)

DISCOS VENDIDOS (em milhões)

Anos Vendas

1992 76,6

1993 44,8

1994 44,3

1995 34,5

1996 44

1997 60

Dados hipotéticos d) COMÉRCIO EXTERIOR

BRASIL – 1989-98 Anos Quantidade (1.000 t)

Exportação Importação

1989 98.010 75.328

1990 109.100 71.855

1991 123.994 64.066

1992 119.990 60.718

1993 178.790 55.056

1994 141.737 53.988

1995 146.351 48.870

1996 133.832 60.605

1997 142.382 61.975

1998 169.396 58.085

Fonte: Dados hipotéticos Gráfico em colunas ou em barras É a representação de uma série por meio de retângulos, dispostos verticalmente (em colunas) ou horizontalmente (em barras).

Page 10: Apostila de Estatística Básica

Ana Lúcia Guimarães Carvalho

ESTATÍSTICA 10

Quando em colunas, os retângulos têm a mesma base e as alturas são proporcionais aos respectivos dados. Quando em barras, os retângulos têm a mesma altura e os comprimentos são proporcionais aos respectivos dados. Assim estamos assegurando a proporcionalidade entre as áreas dos retângulos e os dados estatísticos. Exemplos: a) Gráfico em colunas

CONSTRUÇÃO DE AERONAVES BRASIL - 1994-99

ANOS UNIDADES

1994 184

1995 171

1996 167

1997 203

1998 199

1999 197

Fonte: Dados Hipotético

Construção de Aeronaves

Brasil – 1994-99

0

50

100

150

200

250

1994 95 96 97 98 99

Un

ida

de

s

Anos

b) Gráfico em barras

PRODUÇÃO DE ALHO BRASIL – 2000

Estados Quantidade

(t)

Santa Catarina 13.973

Minas Gerais 13.389

Rio Grande do Sul 6.892

Goiás 6.130

São Paulo 4.179

Fonte fictícia

Produção de Alho Brasil – 2000

0 2 4 6 8 10 12 14

São Paulo

Goiás

Rio Grande do Sul

Minas Gerais

Santa Catarina

toneladas

c) Gráfico em colunas ou em barras múltiplas Este tipo de gráfico é geralmente empregado quando queremos representar, simultaneamente, dois ou mais fenômenos estudados com o propósito de comparação. Exemplo:

PÚBLICO NO BRASIL QUE FREQÜENTA CINEMA - 1994-2000

Ano Filmes nacionais

%

Filmes

estrangeiros %

1994 16 84

1995 18 82

1996 21 79

1997 25 75

1998 30 70

1999 29 71

2000 31 69

Fonte hipotética

Page 11: Apostila de Estatística Básica

Ana Lúcia Guimarães Carvalho

ESTATÍSTICA 11

Público no Brasil que Freqüenta Cinema

0102030405060708090

100

94 95 96 97 98 99 00

Filmes nacionaisFilmes estrangeiros

Pe

rce

ntu

al

AnoFonte hipotética

Exercícios 1) Represente as tabelas usando o gráfico em colunas: a)

CHEGADA DE VISITANTES BRASIL - 1997-2000

ANOS NÚMERO

(milhares)

1997 1.450

1998 1.550

1999 1.700

2000 1.900

Fonte: hipotética b)

ENTREGA DE GASOLINA PARA CONSUMO - BRASIL – 1997-00

ANOS QUANTIDADE

(1.000 m3)

1997 9.700

1998 11.100

1999 9.727

2000 9.347

Dados hipotéticos

2) Usando o gráfico em barras, represente as tabelas:

a)

PRODUÇÃO DE OVOS DE GALINHA BRASIL - 1999

REGIÃO QUANTIDADE

(1.000 dúzias)

Norte 66.092

Nordeste 356.810

Sudeste 937.463

Sul 485.098

Centro-Oeste 118.468

Fonte: Hipotética

b) MORADORES DO BAIRRO A, SEGUNDO

O HÁBITO DE ASSISTIR A NOVELAS HÁBITO PERCENTUAL

Sim 82%

Não 18%

Total 100%

Fonte: fictícia

3) Represente as tabelas por meio de um gráfico de colunas múltiplas. a)

NATALIDADE SEGUNDO AS REGIÕES DO PAÍS

(em %) 1940 1960 1980 Norte 54,4 57,4 43,6

Nordeste 53,5 52,6 41,5

Sudeste 43,7 42,5 28,9

Sul 39,2 41,7 29,4

Centro-Oeste 46,8 47,0 35,9

Fonte: jornal Folha de S. Paulo, 21/7/88

Gráfico em Setores Este gráfico é construído com base em um círculo, e é empregado sempre que

Page 12: Apostila de Estatística Básica

Ana Lúcia Guimarães Carvalho

ESTATÍSTICA 12

desejamos ressaltar a participação do dado no total. O total é representado pelo círculo, que fica dividido em tantos setores quantas são as partes. Os setores são tais que suas áreas são respectivamente proporcionais aos dados da série. Obtemos cada setor por meio de uma regra de três simples e direta, lembrando que o total da série corresponde a 360º. Exemplo:

REBANHOS BRASILEIROS 1988

ESPÉCIE QUANTIDADE

(milhões de cabeças)

Bovinos 140

Suínos 32

Ovinos 20

Caprinos 11

Total 203

Fonte: IBGE Temos:

x2 = 56,7 x2 = 57º

x3 = 35,4 x3 = 35º

x4 = 19,5 x4 = 20º

Com esses dados (valores em graus), marcamos num círculo de raio arbitrário, com um transferidor, os arcos correspondentes, obtendo o gráfico:

REBANHOS BRASILEIROS – 1988

Bovino

Suíno

Ovino

Caprino

Fonte:

IBGE

Exercícios:

1) Represente as tabelas por meio de gráficos em setores.

a) QUEM DOMINA O SETOR

FARMACÊUTICO % de participação

no mercado Número de companhias

Americana 22 Italiana 4 Inglesa 6 Francesa 5 Alemã 10 Austríaca/Holandesa 2 Suíça 6 Subtotal 280 Origem nacional 55 Total 335

Fonte: Jornal Folha de S, Paulo, 23/7/88 c)

A OCUPAÇÃO DE CADA UM

Fonte: Revista Veja, jun/87 c)

ÁREA TERRESTRE BRASIL REGIÕES RELATIVA

(%) Norte 45,25 Nordeste 18,28 Sudeste 10,85 Sul 6,76 Centro-Oeste 18,86 Total 100,00

Fonte: IBGE

x1= 248,2 x1 = 248º 203 __ 360º 140 __ x1

Fazendeiros e empresários

Executivos, profissionais liberais e outros Operários

Total no Congresso 37% 62% 1%

PMDB 39% 60% 0,3%

PFL 37% 62% 0,0%

PDS 50% 50% 0,0%

PDT 19% 76% 4%

PT 0% 80% 19%

Page 13: Apostila de Estatística Básica

Ana Lúcia Guimarães Carvalho

ESTATÍSTICA 13

Cartograma O cartograma é a representação sobre uma carta geográfica. Este gráfico é empregado quando o objetivo é o de figurar os dados estatísticos diretamente relacionados com áreas geográficas ou políticas. Distinguimos duas aplicações:

a) Representar dados absolutos (população) – neste caso, lançamos mão, em geral, dos pontos, em número proporcional aos dados.

b) Representar dados relativos (densidade) – neste caso, lançamos mão, em geral, de hachuras.

Exemplo: POPULAÇÃO PROJETADA DA REGIÃO

SUL DO BRASIL - 1990 ESTADO POPULAÇÃO

(hab.) ÁREA (Km2)

DENSIDADE

Paraná 9.137.700 199.324 45,8 Santa

Catarina 4.461.400 95.318 46,8

Rio Grande do

Sul

9.163.200 280.674 32,6

Fonte: IBGE POPULAÇÃO PROJETADA DA REGIÃO

SUL DO BRASIL - 1990

DENSIDADE POPULACIONAL

PROJETADA DA REGIÃO SUL DO BRASIL - 1990

Pictograma O pictograma constitui um dos processos que melhor fala ao público, pela sua forma ao mesmo tempo atraente e sugestiva. A representação gráfica consta de figuras. Exemplos:

AUMENTA CONSUMO DE GÁS (Consumo mensal de gás de nafta na região

metropolitana de São Paulo em milhões me m3)

Fonte: Jornal Folha de S. Paulo, jul./88

Menos de 33,0 hab/Km2 Menos de 46,0 hab/Km2 Menos de 47,0 hab/Km2

• 400.000 habitantes

27,39 JAN./88

28,00 FEV./

28,71 MAR./

29,03 ABR./

30,15 MAI./

Page 14: Apostila de Estatística Básica

Ana Lúcia Guimarães Carvalho

ESTATÍSTICA 14

CRESCE O NÚMERO DE PASSAGEIROS NOS ÔNIBUS

URBANOS DE CAMPINAS (SP) (em milhões)

Fonte: Jornal Folha de São Paulo, jul./98

APURAÇÃO DOS VOTOS PARA PRESIDENTE Até 22h34, em %

Fonte: jornal Folha de S. Paulo, 5 out. 1994 Exercícios 1)(Enem) Um estudo sobre o problema do

desemprego na Grande São Paulo, no período 1985-1996, realizado pelo SEADE-DIEESE, apresentou o seguinte gráfico sobre taxa de desemprego.

Pela análise do gráfico, é correto afirmar que, no período considerado:

a) a maior taxa de desemprego foi de 14%.

b) A taxa de desemprego no ano de 1995 foi a menor do período.

c) A partir de 1992, a taxa de desemprego foi decrescente.

d) No período 1985-1996, a taxa de desemprego esteve entre 8% e 16%.

e) A taxa de desemprego foi crescente no período compreendido entre 1988 e 1991.

MÉDIAS ANUAIS DA TAXA DE

DESEMPREGO TOTAL GRANDE SÃO PAULO

1985-1996

0%

2%

4%

6%

8%

10%

12%

14%

16%

85 86 87 88 89 90 91 92 93 94 95 96

Fonte: SEP, Convênio SEADE-DIEESE 2)(Enem) Uma pesquisa de opinião foi realizada para avaliar os níveis de audiência de alguns canais de televisão, entre 20h e 21h, durante uma determinada noite. Os resultados obtidos estão representados no gráfico de barras a seguir:

0

20

40

60

80

100

TvA TvB TvC TvD Nenhum

canal

de

re

sid

en

cia

I. O número de residências atingidas nessa pesquisa foi, aproximadamente , de:

a) 100 c) 150 e) 220 b) 135 d) 200 II. A percentagem de entrevistados que

declararam estar assistindo à TvB é aproximadamente igual a:

a) 15% c) 22% e) 30% b) 20% d) 27%

140,1 1993

152,4 1994

158,8 1995

162,1 1996

166,2 1997

FHC (PSDB)

Lula (PT)

Enéas (Prona)

Quércia (PMDB)

Amim (PPR)

Brizola (PDT)

54,0 24,2

6,7 5,8

5,6 2,9

Page 15: Apostila de Estatística Básica

Ana Lúcia Guimarães Carvalho

ESTATÍSTICA 15

3)(Univali) O gráfico mostra as vendas de televisores em uma loja:

0

10

20

30

40

50

60

Jan. Fev. Mar. Abr. Maio Jun.Mês

Un

ida

de

s v

en

did

as

Pode-se afirmar que:

a) as vendas aumentaram mês a mês. b) foram vendidos 100 televisores até

junho. c) as vendas do mês de maio foram

inferiores à soma das vendas de janeiro e fevereiro.

d) foram vendidos 90 televisores até abril.

e) Se cada televisor é vendido por R$240,00, em maio a loja faturou, com as vendas desse produto, R$7.200,00.

4)(Enem) Para convencer a população local da ineficiência da Companhia Telefônica Vilatel na expansão da oferta de linhas, um político publicou no jornal local o gráfico I, abaixo representado. A companhia Vilatel respondeu publicando dias depois o gráfico II, onde pretende justificar um grande aumento na oferta de linhas. O fato é que, no período considerado, foram instaladas, efetivamente, 200 novas linhas telefônicas.

Gráfico I

2.0002.020

2.0402.0602.0802.100

2.1202.1402.160

2.1802.200

Jan. Abr. Ago. Dez.

tota

l d

e lin

ha

s t

ele

fôn

ica

s

GRÁFICO II

2.000

2.050

2.100

2.150

2.200

Jan. Abr. Ago. Dez.Nº

tota

l d

e lin

ha

s t

ele

fôn

ica

s

Analisando os gráficos, pode-se concluir que: a) o gráfico II representa um crescimento

real maior do que o do gráfico I. b) o gráfico I apresenta o crescimento real.

Sendo o II incorreto. c) o gráfico II apresenta o crescimento

real, sendo o gráfico I incorreto. d) a aparente diferença de crescimento nos

dois gráficos decorre da escolha das diferentes escalas.

e) os dois gráficos são incomparáveis, pois usam escalas diferentes.

5) Analisando o gráfico responda:

a) Quantas unidades do produto A foram vendidas em janeiro? E em fevereiro?

b) Em que mês o produto B atingiu a venda de 70.000 unidades?

c) Em que mês os dois produtos tiveram o mesmo número de unidades vendidas?

d) Em que meses o produto B foi mais vendido que o produto A?

6) O gráfico nos mostra o número de chamadas

telefônicas ocorridas numa determinada cidade de 1995 a 1999. Construa uma tabela que represente esse gráfico.

0102030405060708090

JAN FEV MAR ABR MAI JUN

meses

venda (em mil

Produto A

Produto B

Page 16: Apostila de Estatística Básica

Ana Lúcia Guimarães Carvalho

ESTATÍSTICA 16

7) O gráfico a seguir fornece a evolução do preço médio de um videocassete brasileiro, de 1994 a 1999. Construa a tabela referente ao gráfico e responda:

0

200

400

600

800

1000

1200

1994 1995 1996 1997 1998 1999

anos

preços (US$)

8) O gráfico nos mostra o movimento de

importações e das exportações de um país, de 1995 a 1999. Faça uma tabela que represente esse gráfico.

0

500

1000

1500

2000

2500

3000

3500

4000

4500

5000

1995 1996 1997 1998 1999

Importação

Exportação

anos

milhões de dólares

9) O gráfico abaixo nos mostra a participação

em 47 vôos semanais para o exterior de algumas empresas brasileiras (dados de outubro de 1991). Construa a tabela referente ao gráfico apresentado.

9%

23%

68%

Varig

Transbrasil

Vasp

TÉCNICA DE SOMATÓRIO Para indicarmos a soma dos xi (x índice i) valores de uma variável x, isto é, a soma de x1 + x2 + x3 + ... + xn, utilizamos o símbolo grego sigma (Σ), denominado, em Matemática, SOMATÓRIO. Assim, a soma x1 + x2 + x3 + ... + xn

pode ser representado por ∑=

n

1iix (somatório de

xi, onde x varia de 1 a n).

TÉCNICAS DE SOMATÓRIO são as técnicas que auxiliam na soma dos xi valores de uma variável x.

VARIÁVEL é o conjunto de valores

possíveis que representam um fenômeno.

0

50

100

150

200

250

300

350

400

450

1995 1996 1997 1998 1999

anos

número de chamadas

a) Que nome se dá a esse tipo de gráfico? b) Qual era o preço médio do

videocassete brasileiro em 1987? c) Qual a variação do preço médio do

videocassete brasileiro entre 1986 e 1991?

Fonte: revista Veja

Fonte: revista Isto É

Page 17: Apostila de Estatística Básica

Ana Lúcia Guimarães Carvalho

ESTATÍSTICA 17

Ex.: x = {0, 1, 2, 3, ..., 10} x = variável i = índice ou ordem que o elemento ocupa na seqüência x1 = 0 x3 = 2 x2 = 1 x4 = 3 , e assim por diante.

SEQÜÊNCIA é uma função cujo domínio é o conjunto de números positivos que indicam a posição.

Ex.: X = {x1, x2, x3, ... , xn} ⇒ {1, 2,

3, .. , n} é o conjunto das posições PROPRIEDADES:

a) ∑=

n

1iix = x1 + x2 + x3 + ... + xn

Ex.: Sendo o conjunto X = {1, 3, 5, 6, 8, 9} faça:

• ∑=

6

1iix = x1 + x2 + x3 + x4 + x5 + x6 = 1 + 3

+ 5 + 6 + 8 + 9 = 32

• ∑=

5

3iix = x3 + x4 + x5 = 5 + 6 + 8 =19

b) ∑=

n

1i

k = 44 344 21vezesn

k...kkk ++++ = n·k, onde k é

uma constante real.

Ex.: Determine 81

7

i =

∑ = 8 + 8 + 8 + 8 + 8 + 8

+ 8 = 7·8 = 56

c) i

n

1i

xk∑=

= kx1 + kx2 + kx3 + kx4 + ...+ kxn =

k·∑=

n

1iix , onde k é uma constante real.

Ex.: Sendo o conjunto x = {1, 3, 5, 6, 8, 9} determine:

∑=

6

2iix3 = 3x2 + 3x3 + 3x4 + 3x5 + 3x6 = 3·3 +

3·5 + 3·6 + 3·8 + 3·9 = 93 Aplicando a propriedade temos,

∑=

6

2iix3 = 3·∑

=

6

2iix = 3(x2 + x3 + x4 + x5 + x6) =

3(3 + 5 + 6 + 8 + 9) = 3·31 = 93

d) xi jji∑∑ = x11 + x12 + ... + xij

Seja por exemplo a tabela

J Níveis fator 2

i Níveis fator 1 1 2 3

1 X11 X12 X13 Σx1j

2 X21 X22 X23 Σx2j

Σxi1 Σxi2 Σxi3 Σxij

P

N

1 2 3 1 28 35 46 109 2 36 48 62 146 64 83 108 255

xij ⇒ i → linha j → coluna como fica a notação de somatório:

da 1ª coluna → x11 + x21 = ∑=

2

1i

xi1 = 28 + 36 =

64

da 1ª linha → x11 + x12 + x13 = ∑=

3

1j

x1j = 28 +

35 + 46 = 109

Page 18: Apostila de Estatística Básica

Ana Lúcia Guimarães Carvalho

ESTATÍSTICA 18

Ex. Seja a matriz M =

98

64determine

∑∑= =2i

2

1jijx = x21 + x22 = 8 + 9 = 17

e)∑=

n

1iiiyx = x1·y1 + x2·y2 + ... + xn·yn

Ex.: Sejam os conjuntos X={0,1,2,3,4,5,6} e Y = {5,6,7,8,9}, determine:

∑=

5

3iiiyx = 2·7 + 3·8 + 4·9 = 14 + 24 + 36 =

74

f) ∑=

+n

1iii )yx( = (x1 + y1)+(x2 + y2)+...+(xn + yn)

= ∑=

n

1iix + ∑

=

n

1iiy

Ex.: Sejam os conjuntos X = {0,1,2,3, 4,5,6} e Y = {5,6,7,8,9}, determine:

∑=

+5

2iii )yx( = ∑

=

5

2iix + ∑

=

5

2iiy = 2 + 3 + 4 + 5 +

6 + 7 + 8 + 9 = 44

g) ∑=

+n

1i

ti )ax( = (x1 + a)t + (x2 + a)t + (x3 + a)t

+ ... + (xn + a)t , onde a é uma constante real Ex.: Seja X = {2, 3, 4, 5, 6}, determine:

∑=

+4

1i

2i )1x( = ( 2 + 1)2 + (3 + 1)2 + (4 + 1)2

+ (5 + 1)2 = 32 + 42 + 52 + 62 = 9 + 16 + 25 +

36 = 86

EXERCÍCIOS

1) Desenvolva os seguintes somatórios:

a) ∑=

7

1iix c) ∑

=

7

3iix

b) ∑=

3

1iiy d) ∑

=

10

4iiy

2) Sendo X = {2, 5, 6, 7} calcule:

a) ∑=

4

1iix b)∑

=

2

1iix

c) ∑=

+3

1ii )1x( d)∑

=

+4

2i

2i )3x(

3) Sendo X = {1, 2, 3, 6}, calcule:

a) ∑=

⋅4

1iix10 b)∑

=

⋅+4

1ii)x102(

4) Calcule os seguintes somatórios, sendo Y = {0, 4, 3, 7}

a) ∑=

3

1iiy b) ∑

=

4

1i

8 c) ∑=

4

1iiy4

d) ∑=

⋅3

1ii 10y e)∑

=

+3

1ii)y125(

f)∑=

−3

1ii )y3( g) ∑

=

−+4

1iii )10y3y4(

h) ∑=

+−4

1iii )y2y3(

5) Sendo X = {3, 7, 2, 1} e Y = {0, 3, 1, 2}, calcule:

a) ∑=

+4

1iii )yx( b) ∑

=

−4

1iii )yx(

c) ∑=

+2

1i

2i )x2( d) ∑

=

+4

1i

2ii )yx(

Page 19: Apostila de Estatística Básica

Ana Lúcia Guimarães Carvalho

ESTATÍSTICA 19

e) ∑=

4

1iii yx f) ∑

=

+4

1ii )1x(

f) ∑=

4

1iix +∑

=

4

1iiy g) ∑

=

++4

1iii )y2x(

6) Sendo ∑=

4

1iix =10 , ∑

=

4

1iiy =20 e ∑

=

4

1i

2ix =30,

calcule:

a) ∑=

+4

1iii )yx( b) ∑

=

+4

1i

2i )3x(

c) ∑=

+4

1iii )yx4(

7) Sendo M =

−−

−−

1253

5421

3362

, determine:

a) ∑=

3

1i2ix b) ∑

=

4

1jj3x

c) ∑ ∑= =

3

1i

3

2jijx d)∑∑

= =

3

1i

4

1jijx

DISTRIBUIÇÃO DE FREQÜÊNCIA Exemplo: Tabela primitiva

Estatura de 40 alunos do Colégio A

166 160 161 150 162 160 165 167 164 160 162 161 168 163 156 173 160 155 164 168 155 152 163 160 155 155 169 151 170 164 154 161 156 172 153 157 156 158 158 161 Rol

Estatura de 40 alunos do Colégio A 150 151 152 153 154 155 155 155 155 156 156 156 157 158 158 160 160 160 160 160 161 161 161 161 162 162 163 163 164 164 164 165 166 167 168 168 169 170 172 173

No exemplo dado, a variável em questão, estatura, será observada e estudada muito mais facilmente quando dispusermos valores ordenados em uma coluna e colocarmos, ao lado de cada valor, o número de vezes que aparece repetido.]

Denominamos freqüência o número de alunos que fica relacionado a um determinado valor da variável. Obtemos, assim, uma tabela que recebe o nome de distribuição de freqüência: Tabela I ESTATURA DE 40 ALUNOS DO COLÉGIO

A

ESTAT. (cm)

FREQ. ESTAT. (cm)

FREQ.

150 1 163 2 151 1 164 3 152 1 165 1 153 1 166 1 154 1 167 1 155 4 168 2 156 3 169 1 157 1 170 1 158 2 172 1 160 5 173 1 161 4 162 2

TOTAL

40

Freqüência – repetição de determinado dado.

Tabela Primitiva – tabela cujos elementos não foram numericamente organizados

Rol – tabela obtida após a ordenação dos dados .

Page 20: Apostila de Estatística Básica

Ana Lúcia Guimarães Carvalho

ESTATÍSTICA 20

O processo dado exige muito espaço, mesmo quando o número de valores da variável (n) é de tamanho razoável. A solução mais aceitável, pela própria natureza da variável contínua, é o agrupamento dos valores em vários intervalos. Deste modo, estaremos agrupando os valores da variável em intervalos, sendo que, em estatística, preferimos chamar os intervalos de classes. Chamando de freqüência de uma classe o número de valores da variável pertencentes à classe, os dados da tabela anterior podem ser dispostos em uma tabela denominada distribuição de freqüência com intervalos de classe. Tabela II

ESTATURA DE 40 ALUNOS DO

COLÉGIO A ESTATURAS

(cm) FREQÜÊNCIA

150├ 154 4 154 ├ 158 9 158 ├ 162 11 162 ├ 166 8 166 ├ 170 5 170 ├ 174 3

Total 40

OBS: Os intervalos de classe devem ser escritos, de acordo com a Resolução 886/66 do IBGE, em termos de desta quantidade até menos aquela, empregando, para isso o símbolo ├ (inclusão de li e exclusão de Li). Ao agruparmos os valores da variável em classes, ganhamos em simplicidade mas perdemos em pormenores. Assim, na tabela I, podemos verificar, facilmente, que quatro alunos têm 161 cm de altura e que não existe nenhum aluno com 171 cm de altura. Já na tabela II não podemos ver se algum aluno tem a estatura de 159 cm. No entanto, sabemos, com segurança, que onze alunos têm estatura compreendida entre 158 e 162 cm. O que se pretende com a construção dessa nova tabela é realçar o que há de essencial nos dados e, também, tornar possível o uso de técnicas analíticas para sua

total descrição, até porque a Estatística tem por finalidade analisar o conjunto de valores, desinteressando-se por casos isolados. Exercício:

1) Observe a tabela seguinte.

Algumas informações sociais sobre os 30 funcionários da Indústria Santo Afonso.

Nº Estado

Civil Nº de depen dentes

Grau de instrução

Salário (x mínimo)

1 casado 2 1º grau 3 2 casado 2 1º grau 3 solteiro 0 2º grau 6

4 divorc. 2 2º grau 6 5 casado 2 superior 15 6 solteiro 0 1º grau 3 7 casado 2 2º grau 6 8 casado 3 1º grau 3 9 solteiro 0 1º grau 3

10 casado 2 1º grau 3 11 divorc. 3 1º grau 3 12 casado 2 1º grau 3 13 casado 2 1º grau 3 14 casado 2 2º grau 15 15 solteiro 0 1º grau 4 16 solteiro 0 2º grau 8 17 solteiro 1 1º grau 4 18 casado 2 1º grau 4 19 casado 2 2º grau 8 20 divorc. 2 1º grau 4 21 solteiro 1 superior 15 22 casado 3 1º grau 4 23 casado 2 2º grau 8 24 solteiro 0 1º grau 4 25 casado 2 2º grau 8 26 solteiro 1 1º grau 4 27 solteiro 0 2º grau 8 28 casado 2 1º grau 4 29 solteiro 0 2º grau 8 30 solteiro 0 1º grau 4 Fonte: dados hipotéticos Elabore uma tabela de freqüência (absoluta e relativa) considerando como variável:

a) o estado civil.

b) o número de dependentes.

Page 21: Apostila de Estatística Básica

Ana Lúcia Guimarães Carvalho

ESTATÍSTICA 21

c) O grau de instrução.

d) O salário.

2) As notas de Estatística de uma turma de 50 alunos estão anotadas na tabela a seguir. Faça uma tabela de freqüência (absoluta e relativa) para essas notas.

NOTAS DE ESTATÍSTICA

4 6 8 5 8 5 7 4 10 6 7 5 6 4 6 7 10 10 5 10 5 7 5 8 7 4 5 6 7 6 7 9 9 6 5 9 6 5 9 8 10 8 5 6 7 5 6 8 5 4 ELEMENTOS DE UMA DISTRIBUIÇÃO DE FREQÜÊNCIA 1 – Classe

As classes são representadas simbolicamente por i, sendo i = 1,2,3, ... ,K (onde K é o número total de classes da distribuição). 2 – Limites de classe O menor número é o limite inferior da classe ( li ) e o maior número, o limite superior da classe ( Li ) . 3 – Amplitude de um intervalo de classe

Ela é obtida pela diferença entre os limites superior e inferior dessa classe e indicada por hi. Assim:

4 – Amplitude total da distribuição

5 – Amplitude amostral

6 – Ponto médio de uma classe Para obtermos o ponto médio de uma classe, calculamos a semi-soma dos limites da classe ( média aritmética): 7 – Freqüência simples ou absoluta

Classes de freqüência ou, simplesmente, classes são intervalos de variação da variável.

Determinamos limites de classe os extremos de cada classe.

Amplitude de um intervalo de classe ou, simplesmente, intervalo de classe é a medida do intervalo que define a classe.

hi = L i - li

Amplitude total da distribuição ( AT ) é a diferença da última classe ( limite superior máximo) e o limite inferior da primeira classe ( limite inferior mínimo).

AT = L(máx.) – l(mín.)

Amplitude amostral ( AA ) é a diferença entre o valor máximo e o valor mínimo da amostra.

AA = x(max.) – x(min.)

Ponto médio de uma classe ( xi ) é, como o próprio nome indica, o ponto que divide o intervalo de classe em duas partes iguais.

2

Llx ii

i

+=

Freqüência simples ou freqüência absoluta ou, simplesmente freqüência de uma classe ou de um valor individual é o número de observações correspondentes a essa classe ou a esse valor.

Page 22: Apostila de Estatística Básica

Ana Lúcia Guimarães Carvalho

ESTATÍSTICA 22

A freqüência simples é simbolizada por fi ( lemos: f índice i ou freqüência da classe i ). A soma de todas as freqüências é representada pelo símbolo de somatório: NÚMERO DE CLASSES INTERVALO DE CLASSE Para a determinação do número de classes de uma distribuição podemos lançar mão da regra de Sturger, que nos dá o número de classes em função do número de valores da variável: onde: i é o número de classe; n é o número total de dados. Decidido o número de classes que deve ter a distribuição, resta-nos resolver o problema da determinação da amplitude do intervalo de classe, o que conseguimos dividindo a amplitude total pelo número de classes:

Quando o resultado não é exato, devemos arredonda-lo para mais. Exercício: 1) As notas obtidas por 50 alunos de uma

classe foram: 1 2 3 4 5 6 6 7 7 8 2 3 3 4 5 6 6 7 8 8 2 3 4 4 5 6 6 7 8 9 2 3 4 5 5 6 6 7 8 9 2 3 4 5 5 6 7 7 8 9

a) Complete a distribuição de freqüência :

i Notas xi fi 1 0 ├ 2 2 2 ├ 4 3 4 ├ 6 4 6 ├ 8 5 8 ├10 ∑ =if

b) Agora, responda:

1) Qual a amplitude amostral? 2) Qual a amplitude da distribuição? 3) Qual o número de classes da

distribuição? 4) Qual o limite inferior da quarta classe? 5) Qual o limite superior da classe de

ordem 2? 6) Qual a amplitude do segundo intervalo

de classe? c) Complete: 1) h3 = _____ 2) l1 = _____ 3) x2 = ___ 4) n = _____ 5) L3 = ____ 6) f5 = ____ TIPOS DE FREQÜÊNCIA

A soma das freqüências simples é igual ao número total dos dados:

∑=

k

1i

fi

i ≅ 1 + 3,3 . log n

h ≅i

AT

Freqüências simples ou absolutas (fi) são os valores que realmente representam o número de dados de cada classe.

nf i =∑

Freqüência relativa (fri) são os valores das razões entre as freqüências simples e a freqüência total

∑=

i

ii

f

ffr

Page 23: Apostila de Estatística Básica

Ana Lúcia Guimarães Carvalho

ESTATÍSTICA 23

O propósito das freqüências relativas é o de permitir a análise ou facilitar as comparações.

DISTRIBUIÇÃO DE FREQÜÊNCIA SEM INTERVALO DE CLASSE Quando se trata de variável discreta de variação relativamente pequena, cada valor pode ser tomado como um intervalo de classe e, nesse caso, a distribuição é chamada distribuição sem intervalo de classe, tomando a seguinte forma:

xi fi x1 f1

x2 f2

: : xn fn

∑ = nf i

Exemplo: Seja X a variável “número de cômodos das casas ocupadas por vinte famílias entrevistadas”:

i xi fi 1 2 4 2 3 7 3 4 5 4 5 2 5 6 1 6 7 1 ∑ = 20

Exercícios:

1) Considerando as notas de um teste de inteligência aplicado a 100 alunos:

64 78 66 82 74 103 78 86 103 87 73 95 82 89 73 92 85 80 81 90 78 86 78 85 98 75 73 90 86 101 86 84 86 76 76 83 86 84 85 103 76 80 92 73 87 70 85 79 93 102 82 90 83 81 85 72 81 96 81 85 68 96 86 70 72 74 84 99 81 89 71 73 63 74 98 78 78 83 96 105 95 94 88 62 91 83 98 93 83 76 94 75 67 95 708 98 71 92 72 73

Forme uma distribuição de freqüência. Determine: a) ∑ if b) fri c) Fi d) Fri

2) A distribuição abaixo indica o número de acidentes ocorridos com 70 motoristas de uma empresa de ônibus:

Nº acidentes 0 1 2 3 4 5 6 7 Nº motoristas 20 10 16 9 6 5 3 1 Determine: a) o número de motoristas que não sofreram

nenhum acidente: b) o número de motoristas que sofreram pelo

menos 4 acidentes; c) o número de motoristas que sofreram

menos de 3 acidentes; d) o número de motoristas que sofreram no

mínimo 3 e no máximo 2 acidentes; e) a percentagem dos motoristas que sofreram

no máximo 2 acidentes.

3) Sejam as alturas (em centímetros) de 25 alunos de uma determinada classe:

Freqüência acumulada (Fi) é o somatório de todas as classes anteriores da referida classe.

Fk = f1 + f2 + ... + fk

Freqüência acumulada relativa (Fri) de uma classe é a freqüência acumulada da classe, dividida pela freqüência total da distribuição.

∑=

i

ii

f

FFr

Page 24: Apostila de Estatística Básica

Ana Lúcia Guimarães Carvalho

ESTATÍSTICA 24

150 159 157 151 152

156 153 163 159 175

162 162 164 158 159

164 168 166 160 162 a) Calcule a amplitude do rol. b) Calcule a amplitude para cada intervalo de

classe. c) Ache a distribuição de freqüência com

intervalos de classe, a freqüência relativa, a freqüência acumulada e a freqüência acumulada relativa.

4) A tabela abaixo apresenta uma distribuição

de freqüência das áreas de 400 lotes:

ÁREAS (m2)

Nº DE LOTES

300 ├ 400 14

400 ├ 500 46

500 ├ 600 58

600 ├ 700 76

700 ├ 800 68

800 ├ 900 62

900 ├ 1000 48

1000 ├ 1100 22

1100 ├ 1200 6

Com referência a essa tabela, determine: a) a amplitude total; b) o limite superior da quinta classe; c) o limite inferior da oitava classe; d) o ponto médio da sétima classe; e) a amplitude do intervalo da segunda classe; f) a freqüência da quarta classe; g) a freqüência relativa da sexta classe; h) a freqüência acumulada da quinta classe; i) o número de lotes cuja área não atinge 700

m2; j) o número de lotes cuja área atinge e

ultrapassa 800 m2; k) a percentagem dos lotes cuja área não

atinge 600 m2; l) a percentagem dos lotes cuja área seja

maior ou igual a 900 m2;

m) a percentagem dos lotes cuja área é de 500m2, no mínimo, mas inferior a 1.000m2;

n) a classe do 72º lote; o) até que classe estão incluídos 60% dos lotes. 5) Baseando que um amostra apresentou os resultados abaixo, clacule a amplitude do intervalo de classe ( h ) e o número total de classes ( i ). a) n=50 AA=150 b) n=70 AA=10 6) Complete os dados que faltam na

distribuição de freqüência: a)

I Xi fi fri fi 1 0 1 0.05 2 1 0.15 4 3 2 4 4 3 0.25 13 5 4 3 6 5 18 7 6 19 8 7 ∑ = 20 ∑ = 001.

b) i Classes xi fi Fi fri

1 0 ├ 2 1 4 0,04 2 2 ├ 4 8 3 4 ├ 6 5 30 0,18 4 7 27 0,27 5 15 72 6 10 ├ 12 83 7 13 10 93 0,10 8 14 ├ 16 0,07 ∑ = ∑ =

REPRESENTAÇÃO GRÁFICA DE UMA DISTRIBUIÇÃO Uma distribuição de freqüência pode ser representada graficamente pelo histograma, pelo polígono de freqüência e pelo polígono de freqüência acumulada (ogiva de Galton).

Page 25: Apostila de Estatística Básica

Ana Lúcia Guimarães Carvalho

ESTATÍSTICA 25

Construímos qualquer um dos gráficos mencionados utilizando o primeiro quadrante do sistema de eixos coordenados cartesianos ortogonais. Na linha horizontal (eixo das abscissas) colocamos os valores da variável e na linha vertical ( eixo das ordenadas), as freqüências. HISTOGRAMA As larguras dos retângulos são iguais às amplitudes dos intervalos de classe. As alturas dos retângulos devem ser proporcionais às freqüências das classes, sendo a amplitude dos intervalos iguais. Isso nos permite tomar as alturas numericamente iguais às freqüências. Exemplo: À distribuição da tabela corresponde o seguinte histograma:

ESTATURA DE 40 ALUNOS DO COLÉGIO A

i ESTATURAS (cm)

fi

1 150├ 154 4 2 154 ├ 158 9 3 158 ├ 162 11 4 162 ├ 166 8 5 166 ├ 170 5 6 170 ├ 174 3 Total ∑ = 40f i

0

2

4

6

8

10

12

150 158 162 166 170 174

fre

qu

ên

cia

classes154

O histograma goza de uma propriedade da qual faremos considerável uso: a área de um histograma é proporcional à soma das freqüências. POLÍGONO DE FREQÜÊNCIA

Para realmente obtermos um polígono

(linha fechada), devemos completar a figura, ligando os extremos da linha obtida aos pontos médios da classe anterior à primeira e da posterior à última, da distribuição. Exemplo: ESTATURA DE 40 ALUNOS DO COLÉGIO

A i ESTATURAS

(cm) fi

1 150├ 154 4 2 154 ├ 158 9 3 158 ├ 162 11 4 162 ├ 166 8 5 166 ├ 170 5 6 170 ├ 174 3 Total ∑ = 40f i

0

2

4

6

8

10

12

148 152 156 160 164 168 172 176

fre

qu

ên

cia

Estatura

No caso de termos uma variável essencialmente positiva, cuja distribuição se inicie no valor zero, devemos considerar um intervalo anterior localizado no semi-eixo negativo. Porém consideraremos apenas a parte positiva do segmento que liga o ponto médio

O histograma é formado por um conjunto de retângulos justapostos, cujas bases se localizam sobre o eixo horizontal, de tal modo que seus pontos médios coincidam com os pontos médios dos intervalos de classe.

O polígono de freqüência é um gráfico em linha, sendo as freqüências marcadas sobre perpendiculares ao eixo horizontal, levantadas pelos pontos médios dos intervalos de classe.

Page 26: Apostila de Estatística Básica

Ana Lúcia Guimarães Carvalho

ESTATÍSTICA 26

desse intervalo com a freqüência do intervalo 0├ ... . POLÍGONO DE FREQÜÊNCIA ACUMULADA Exemplo:

ESTATURA DE 40 ALUNOS DO COLÉGIO A

i ESTATURAS (cm)

fi

1 150├ 154 4 2 154 ├ 158 9 3 158 ├ 162 11 4 162 ├ 166 8 5 166 ├ 170 5 6 170 ├ 174 3 Total ∑ = 40f i

0

10

20

30

40

150 154 158 162 166 170 174

Fre

en

cia

Estatura

GRÁFICO DE UMA DISTRIBUIÇÃO DE FREQÜÊNCIA SEM INTERVALO DE CLASSE Uma distribuição de freqüência sem intervalo de classe é representada graficamente por um diagrama onde cada valor da variável é representado por um segmento de reta vertical e de comprimento proporcional à respectiva freqüência.

Exemplo:

i xi fi Fi

1 2 4 4 2 3 7 11 3 4 5 16 4 5 2 18 5 6 1 19 6 7 1 20

∑ = 20

0

2

4

6

8

1 2 3 4 5 6 7

Fre

ên

cia

Também podemos representar a distribuição pelo gráfico da freqüência acumulada, o qual se apresentará com pontos de descontinuidade nos valores observados da variável: Exercícios: 1) Dada a distribuição abaixo, construa para os

dados apresentados:

Áreas (m2)

nº de lotes

300 ├ 400 14 400 ├ 500 46 500 ├ 600 58 600 ├ 700 76 700 ├ 800 68 800 ├ 900 62

900 ├ 1000 48 1000 ├ 1100 22 1100 ├ 1200 6

O polígono de freqüência acumulada é traçado marcando-se as freqüências acumuladas sobre perpendiculares ao eixo horizontal, levantadas nos pontos correspondentes aos limites superiores dos intervalos de classe.

Page 27: Apostila de Estatística Básica

Ana Lúcia Guimarães Carvalho

ESTATÍSTICA 27

a) O histograma; b) o polígono de freqüência; c) o polígono de freqüência acumulada. 2) Dada a distribuição abaixo, construa para

os dados apresentados:

i Classes fi 1 4 ├ 8 2 2 8 ├ 12 5 3 12 ├ 16 9 4 16 ├ 20 6 5 20 ├ 24 2 6 24 ├ 28 1 Σ = 25

3) Conhecidas as notas de 50 alunos:

68 85 33 52 66 77 84 65 74 57

71 35 81 50 35 64 74 47 54 68

80 61 41 91 55 73 59 53 77 45

41 55 78 48 69 85 67 39 60 76

94 88 66 66 73 42 65 94 88 89

pede-se:

a) A distribuição de freqüência começando por 30 e adotando-se o intervalo de classe de amplitude igual a 10.

b) A freqüência acumulada. c) O histograma. d) O polígono de freqüência. f) O polígono de freqüência acumulada. 4) A tabela abaixo apresenta os coeficientes

de liquidez obtidos da análise de balanço em 50 indústrias

3,9 7,4 10,0 11,8 2,3 4,5 10,5 8,4 15,6

18,8 2,9 2,3 0,4 5,0 9,0 5,5 9,2 12,4 4,5 4,4 10,6 5,6 8,5 2,4 17,8 11,6 0,8 7,1 3,2 2,7 16,2 2,7 9,5 13,1 3,8 6,3 4,8 5,3 12,9 6,9 6,3 7,5 2,6 3,3 4,6 7,5 8,7 4,4 7,9 16,0

pede-se:

a) Formar com esses dados uma distribuição com intervalos de classe igual a 3, tais que os limites inferiores sejam múltiplos de 3.

b) Confeccionar o histograma.

c) O polígono de freqüência. d) O polígono de freqüência acumulada correspondente. 5) Um grau de nebulosidade, registrado em décimos, ocorre de acordo com a distribuição abaixo: Nebulo sidade

0 ├ 0,5├ ,5├ 2,5├ 3,5├ 4,5├ 5,5 ├ 6,5├ 7,5├ 8,5├ 9,5├ 10

fi 320 125 75 65 45 45 55 65 90 145 676

Pede-se:

a) A freqüência acumulada. b) O histograma. c) O polígono de freqüência. d) O polígono de freqüência acumulada. 6) Dado o histograma abaixo, construa:

0

2

4

6

8

10

12

8 10 12 14 16 18 20 22

fre

qu

ên

cia

classes

7) Dado o polígono de freqüência abaixo,

construa:

0

2

4

6

8

10

12

14

16

10 14 18 22 26 30 34 36

fre

qu

ên

cia

X

a) O histograma. b) O polígono de freqüência. c) O polígono de freqüência acumulada

a) Uma tabela de freqüência para os dados apresentados.

b) O polígono de freqüência. c) O polígono de freqüência acumulada.

a)Uma tabela de freqüência para os dados apresentados.

b) O histograma. c) O polígono de freqüência acumulada.

Page 28: Apostila de Estatística Básica

Ana Lúcia Guimarães Carvalho

ESTATÍSTICA 28

8) Examinando o histograma abaixo, que corresponde às notas relativas à aplicação de um teste de inteligência a um grupo de alunos, responda:

a) Qual é o intervalo de classe que tem

maior freqüência? b) Qual a amplitude total da distribuição? c) Qual o número total de alunos? d) Qual é a freqüência do intervalo de

classe 110 ├ 120? e) Quais os dois intervalos de classe que

têm a mesma freqüência? f) Quais são os dois intervalos de classe

tais que a freqüência de um é o dobro da freqüência do outro?

g) Quantos alunos receberam notas de teste entre 90 (inclusive) e 110?

h) Quantos alunos receberam notas não-inferiores a 100?

0

5

10

15

20

25

30

40 60 80 100 120 160

fre

qu

ên

cia

classes

140

9) O gráfico mostra a distribuição de uma amostra de garrafas de refrigerantes e seus respectivos volumes em mililitros:

0

100

200

300

400

500

280 300 320Volume (ml)

Fre

ên

cia

(nº

de

ga

rra

fas

a) Quantas garrafas compõem essa amostra? b) Qual a freqüência relativa da classe “300

ml”?

MEDIDAS DE POSIÇÃO

As medidas de posição mais importantes são as medidas de tendência central, que recebem tal denominação pelo fato de os dados observados tenderem, em geral, a se agrupar em torno dos valores centrais. Dentre as medidas de tendência central, destacamos a média aritmética, a mediana e a moda.

MÉDIA ARITMÉTICA ( _

X )

sendo:

_

x a média aritmética; ix os valores da variável;

n o número de valores. Dados não-agrupados Quando desejamos conhecer a média dos dados não-agrupados, determinamos a média aritmética simples. Exemplo: Sabendo-se que a produção leiteira diária da vaca A, durante uma semana, foi de 10, 14, 13, 15, 16, 18 e 12 litros, temos, para produção média da semana:

147

98

7

12181615131410x ==

++++++=

_

Logo:

14x =_

litros

Dados agrupados Sem intervalo de classe

Média aritmética é o quociente da divisão da soma dos valores da variável pelo número deles.

n

xx i∑

=_

Page 29: Apostila de Estatística Básica

Ana Lúcia Guimarães Carvalho

ESTATÍSTICA 29

Neste caso, como as freqüências são números indicadores de cada valor da variável, elas funcionam como fatores de ponderação, o que nos leva a calcular a média aritmética ponderada, dada pela fórmula: Exemplo: Considere a distribuição relativa a 34 famílias de quatro filhos, tomando para variável o número de filhos do sexo masculino: Nº DE FILHOS fi xifi

0 2 0 1 6 6 2 10 20 3 12 36 4 4 16 ∑= 34 ∑= 78

Temos, então:

32x29234

78x

f

fxx

i

ii ,,___

=⇒==⇒=∑∑

isto é:

32x ,_

= meninos Com intervalo de classe Neste caso, convencionamos que todos os valores incluídos em um determinado intervalo de classe coincidem com o seu ponto médio, e determinamos a média aritmética ponderada por meio da fórmula: Onde xi é o ponto médio da classe. Exemplo: Consideremos a distribuição:

i ESTATURAS

(cm) fi xi xifi

1 150 ├ 154 4 152 608 2 154├ 158 9 156 1.404 3 158├ 162 11 160 1.760 4 162├ 166 8 164 1.312 5 166├ 170 5 168 840 6 170├ 174 3 172 516 ∑= 40 ∑= 4406.

cm161x16140

4406

f

fxx

i

ii=⇒===

∑∑ __ .

Exercícios: 1) As idades dos jogadores de um time de

basquetebol são 18, 23, 19, 20 e 21 anos. Qual é a média de idade desses jogadores?

2) Entre sessenta números, vinte são iguais a

5, dez são iguais a 6, quinze são iguais a 8, dez são iguais a 12, e cinco são iguais a 1. Determine a média aritmética desses números.

3) Quatro funcionários A, B, C e D de uma

empresa têm respectivamente 8, 6, 10 e 16 anos de trabalho nessa empresa. O funcionário A recebeu um prêmio de R$ 500,00 por ano de casa; B recebeu um prêmio de R$ 600,00 por ano de casa; e C e D receberam, cada um, R$ 800,00 de prêmio por ano de casa. Qual foi o prêmio médio recebido por ano de casa por esses funcionários?

4) As classes A, B e C da segunda série do

ensino médio tiveram respectivamente as seguintes médias na prova de matemática: 6,5; 6,0 e 7,0. Sabendo que a classe A é formada por 28 alunos, B é formada por 25 alunos e C, por 22 alunos, calcule a nota média de todos os 75 alunos.

5) A tabela mostra a distribuição de freqüência

da carga, em toneladas, dos caminhões que passaram por uma estrada num certo período. Calcule a carga média desses caminhões.

∑∑

=i

ii

f

fxx_

∑∑

=i

ii

f

fxx_

Page 30: Apostila de Estatística Básica

Ana Lúcia Guimarães Carvalho

ESTATÍSTICA 30

Carga (em toneladas)

Número de caminhões

[ 9,5;14,5 [ 18

[ 14,5;19,5 [ 33

[ 19,5;25,5 ] 9

A MODA ( Mo ) Dados não-agrupados Quando lidamos com valores não-agrupados, a moda é facilmente reconhecida: basta, de acordo com a definição, procurar o valor que mais se repete. Exemplo: A série de dados: 7, 8, 9, 10, 10, 10, 11, 12, 13, 15 tem moda igual a 10. Podemos, entretanto, encontrar séries nas quais não exista valor modal, isto é, nas quais nenhum valor apareça mais vezes que outros. É o caso da série: 3, 5, 8, 10, 12, 13 que não apresenta moda ( amodal ). Em outros casos, ao contrário, pode haver dois ou mais valores de concentração. Dizemos, então, que a série tem dois ou mais valores modais. Na série: 2, 3, 4, 4, 4, 5, 6, 7, 7, 7, 8, 9 temos duas modas: 4 e 7 ( bimodal ). Dados agrupados Sem intervalo de classe

Uma vez agrupados os dados, é possível determinar imediatamente a moda: basta fixar o valor da variável de maior freqüência. Exemplo: Dada a distribuição

Nº DE FILHOS fi

0 2 1 6 2 10 3 12 4 4 ∑= 34

A freqüência máxima ( 12 ) corresponde o valor 3 da variável. Logo: Mo = 3 Com intervalo de classe A classe que apresenta a maior freqüência é denominada classe modal. Pela definição, podemos afirmar que a moda, neste caso, é o valor dominante que está compreendido entre os limites da classe modal. O método mais simples para o cálculo da moda consiste em tomar o ponto médio da classe modal. Damos a esse valor a denominação de moda bruta. Temos, então: onde: l é o limite inferior da classe modal; L é o limite superior da classe modal. Exemplo:

Para a distribuição:

i Estaturas fi

Denominamos moda o valor que ocorre com maior freqüência em uma série de valores.

2

LlMo

+=

Page 31: Apostila de Estatística Básica

Ana Lúcia Guimarães Carvalho

ESTATÍSTICA 31

(cm) 1 150 ├ 154 4 2 154 ├ 158 9 3 158 ├ 162 11 4 162 ├ 166 8 5 166 ├ 170 5 6 170 ├ 174 3 ∑ = 40

2

LlMo

+=

1602

320

2

162158Mo ==

==

Logo: Mo = 160 cm A MEDIANA ( Md ) Dados não-agrupados Dada uma série de valores: 5, 13, 10, 2, 18, 15, 6, 16, 9, o primeiro passo é o da ordenação ( crescente ou decrescente ) dos valores: 2, 5, 6, 9, 10, 13, 15, 16, 18 em seguida, tomamos aquele valor central que apresenta o mesmo número de elementos à direita e à esquerda. Em nosso exemplo, esse valor é o 10, já que, nessa série, há quatro elementos acima dele e quatro abaixo. Temos, então: Md = 10 Se, porém, a série dada tiver um número par de termos, a mediana será, por definição, qualquer dos números compreendidos entre os dois valores centrais

da série. Convencionou-se utilizar o ponto médio. Assim, a série de valores: 2, 6, 7, 10, 12, 13, 18, 21 tem para mediana a média aritmética entre 10 e 12 Logo:

112

22

2

1210Md ==

==

donde: Md = 11 Dados agrupados Se os dados agrupam em uma distribuição de freqüência, o cálculo da mediana se processa de modo muito semelhante àquele dos dados não-agrupados, implicando, porém, a determinação prévia das freqüências acumuladas. Ainda aqui, temos que determinar um valor tal que divida a distribuição em dois grupos que contenham o mesmo número de elementos. Para o caso de uma distribuição, porém, a ordem, a partir de qualquer um dos extremos, é dada por:

Sem intervalo de classe Neste caso, basta identificar a freqüência acumulada imediatamente superior à metade da soma das freqüências. A mediana será aquele valor da variável que corresponde a tal freqüência acumulada. Exemplo: Dada a distribuição de freqüência:

Nº DE MENINOS

fi Fi

0 2 2 1 6 8 2 10 18 3 12 30 4 4 34 ∑= 34

A mediana é definida como o número que se encontra no centro de um série de números, estando estes dispostos segundo uma ordem.. É o valor situado de tal forma no conjunto que o separa em dois subconjuntos de mesmo número de elementos.

2

fPos

i∑=

Page 32: Apostila de Estatística Básica

Ana Lúcia Guimarães Carvalho

ESTATÍSTICA 32

Sendo:

172

34

2

f i==

a menor freqüência acumulada que supera esse valor é 18, que corresponde ao valor 2 da variável, sendo este o valor mediano. Logo: Md = 2 meninos No caso de existir uma freqüência acumulada (Fi), tal que:

2

fF

ii∑

= ,

a mediana será dada por:

isto é, a mediana será a média aritmética entre o valor da variável correspondente a essa freqüência acumulada e o seguinte. Exemplo: Dada a distribuição de freqüência:

xi fi Fi 12 1 1 14 2 3 15 1 4 16 2 6 17 1 7 20 1 8

∑ = 8

Temos:

42

8

2

fPos

i===

Logo:

5152

31

2

1615Md ,==

+=

Donde: Md = 15,5 Com intervalo de classe

Neste caso, o problema consiste em determinar o ponto do intervalo em que está compreendida a mediana. Para tanto, temos inicialmente que determinar a classe na qual se acha a mediana – classe mediana. Tal classe será, evidentemente, aquela correspondente à freqüência acumulada imediatamente superior

a 2

f i∑ .

Seguimos os seguintes passos: 1º) Determinamos as freqüências acumuladas.

2º) Calculamos 2

f i∑

3º) Marcamos a classe correspondente à freqüência acumulada imediatamente superior

à 2

f i∑ - classe mediana – e, em seguida,

empregamos a fórmula: na qual: l é o limite inferior da classe mediana; F(ant) é a freqüência acumulada da classe anterior à classe mediana; f é a freqüência simples da classe mediana; h é a amplitude do intervalo da classe mediana. Exemplo: Dada a distribuição de freqüência:

i Estaturas (cm)

fi Fi

1 150 ├ 154 4 4 2 154 ├ 158 9 13 3 158 ├ 162 11 24 4 162 ├ 166 8 32 5 166 ├ 170 5 37 6 170 ├ 174 3 40 ∑ = 40

2

xxMd 1ii ++

=

f

hantF2

f

lMd

i

+=

∑)(

Classe mediana

Page 33: Apostila de Estatística Básica

Ana Lúcia Guimarães Carvalho

ESTATÍSTICA 33

Temos:

202

40

2

f i==

Logo, a classe mediana é a de ordem 3. Então: l = 158, F(ant) = 13, f = 11 e h = 4 substituindo na fórmula:

( )11

28158

11

41320158Md +=

−+=

Md 54160542158 ,, =+= isto é: Md = 160,5 cm Exercícios 1) Considerando os conjuntos de dados:

a) 3, 5, 2, 6, 5, 9, 5, 2, 8, 6

b) 51,6; 48,7; 50,3; 49,5; 48,9

c) 20, 9, 7, 2, 12, 7, 20, 15, 7 d) 15, 18, 20, 13, 10, 16, 14

calcule: I - a média; II - a mediana; III - a moda. 2) Os salários-hora de cinco funcionários de

uma companhia são: R$ 75,00; R$ 90,00; R$ 83,00;R$ 142,00 e R$ 88,00. Determine:

a) a média dos salários-hora; b) o salário-hora mediano; c) o salário modal.

3) As notas de um candidato, em seis provas

de um concurso, foram: 8,4; 9,1; 7,2; 6,8; 8,7 e 7,2. Determine:

a) a nota média; b) a nota mediana; c) a nota modal

4) Considerando as distribuições:

xi 3 4 5 6 7 8 fi 4 8 11 10 8 3

calcule:

a) a média; b) a mediana; c) a moda.

5) Quando trabalhamos com variáveis

contínuas e em grande número, pode ser interessante classificá-las em intervalos iguais, a fim de reduzir o tempo das operações. Nestes casos, para os cálculos das medidas de posição costumamos considerar todos os valores de cada intervalo iguais ao ponto médio do intervalo. Assim, se no intervalo de 10 a 15 tivermos 18 valores, consideraremos que todos os 18 são iguais a 12,5, que é o valor médio entre 10 e 15. Esta medida não costuma acarretar erro considerável.

Com base no que afirmamos acima, determine a média, a mediana e a moda das seguintes distribuições de freqüências:

INTERVALO FREQÜÊNCIA

2 ├ 8 4 8 ├ 14 6

14 ├ 20 8

20 ├ 26 6

INTERVALO FREQÜÊNCIA

1 ├ 2 1

2 ├ 3 4 3 ├ 4 6 4 ├ 5 3 5 ├ 6 1

6) Numa pesquisa feita dentre os alunos de

uma escola para saber da existência de irmãos mais novos, obtiveram-se os dados mostrados na tabela abaixo:

Calcule:

a) o número médio de irmãos mais novos; b) o número mediano de irmãos mais novos; c) a moda de irmãos mais novos.

Page 34: Apostila de Estatística Básica

Ana Lúcia Guimarães Carvalho

ESTATÍSTICA 34

nº de irmãos mais novos

Freqüência

6 4 5 6 4 10 3 12 2 22 1 31 0 18

7) Determine a média, a mediana e a moda

das seguintes distribuições de freqüências:

INTERVALO FREQÜÊNCIA 1,60 ├ 1,65 4 1,65 ├ 1,70 7 1,70 ├ 1,75 9 1,75 ├ 1,80 12 1,80 ├ 1,85 6 1,85 ├ 1,90 2

8) (UFRJ) O gráfico mostra a distribuição de

uma prova de matemática.

0

2

4

6

8

10

1 2 3 4 5 6 7 8 9 10

me

ro d

e a

lun

os

Notas

a) Quantos alunos fizeram a prova? b) Determine a média aritmética das

notas dessa prova. 9) (Unicamp-SP) O gráfico, em forma de

pizza, representa as notas obtidas em uma questão pelos 32.000 candidatos presentes à primeira fase de uma prova de vestibular. Ele mostra, por exemplo, que 32% desses candidatos tiveram nota 2 nessa questão.

Pergunta-se:

a) Quantos candidatos tiveram nota 3?

b) É possível afirmar que a nota média, nessa questão, foi ≤ 2? Justifique sua resposta.

c) Qual é a moda do conjunto das notas de todos os alunos?

d) Qual é a mediana do conjunto das notas de todos os alunos?

4 (12%)

5 (10%)

0 (10%)

1 (20%)

2 (32%)

3 (16%)

10) (Vunesp) Suponhamos que nos

vestibulares desse ano uma universidade tivesse tido, para os seus diversos cursos, uma média de 3,60 candidatos por vaga oferecida. Se para os vestibulares do ano que vem o número de vagas for aumentado de 20% e o número de candidatos aumentar em 10%, qual a média de candidatos por vaga que essa universidade terá no próximo ano?

a) 3,24 b) 3,30 c) 3,36 d) 3,40 e) 3,46

MEDIDAS DE DISPERSÃO OU DE VARIABILIDADE

A média aritmética, a mediana e a moda, são valores que podem servir de comparação para dar a posição de qualquer elemento do conjunto. Entretanto, quando se trata de interpretar dados estatísticos, mesmo aqueles já convenientemente simplificados, é necessário ter-se uma idéia retrospectiva de como se apresentavam esses mesmos dados nas tabelas. Assim, não é o bastante dar uma das medidas de posição para caracterizar perfeitamente um conjunto de valores, pois, mesmo sabendo, por exemplo, que a temperatura média de duas cidades é a mesma, e igual a 24º C, ainda assim somos levados a

Page 35: Apostila de Estatística Básica

Ana Lúcia Guimarães Carvalho

ESTATÍSTICA 35

pensar a respeito do lima dessas cidades. Em uma delas poderá a temperatura variar entre limites de muito calor e de muito frio e haver, ainda, uma temperatura média de 24º C. A outra poderá ter uma variação pequena de temperatura e possuir, portanto, no que se refere à temperatura, um clima mais favorável. As medidas de posição, ainda que considerada como um número que tem a faculdade de representar uma série de valores, não pode, por si mesma, destacar o grau de homogeneidade ou heterogeneidade que existe entre os valores que compões o conjunto. Consideremos os seguintes conjuntos de valores das variáveis x, y e z: X: 70, 70, 70, 70, 70 Y: 68, 69, 70, 71, 72 Z: 5, 15, 50, 120, 160. Calculando a média aritmética de cada um desses conjuntos, obtemos:

70z

70y

70x

=

=

=

_

_

_

Vemos, então, que os três conjuntos apresentam a mesma média aritmética: 70. Entretanto, é fácil notar que o conjunto X é mais homogêneo que os conjuntos Y e Z, já que todos os valores são iguais à média. O conjunto Y, por sua vez, é mais homogêneo que o conjunto Z, pois há menor diversificação entre cada um de seus valores e a média representativa.

Portanto, para qualificar os valores de uma variável, ressaltando a maior ou menor dispersão ou variabilidade entre esses valores e a sua medida de posição, a Estatística recorre às medidas de dispersão ou de variabilidade. Dessas medidas, estudaremos a amplitude total, a variância, o desvio padrão e o coeficiente de variação. AMPLITUDE TOTAL Dados não-agrupados Para os valores: 40, 45, 48, 52, 54, 62 e 70 temos: AT = 70 – 40 = 30 Logo: AT = 30 Quando dizemos que a amplitude total dos valores é 30, estamos afirmando alguma coisa do grau de sua concentração. É evidente que, quanto maior a amplitude total, maior é a dispersão ou variabilidade dos valores da variável. Considerando os conjuntos X, Y e Z citados anteriormente, temos: ATx = 70 – 70 = 0 (dispersão nula) ATy = 72 – 68 = 4 ATz = 160 – 5 = 155 Dados agrupados Sem intervalo de classe

Considerando a tabela:

Chamando de dispersão ou variabilidade a maior ou menor diversificação dos valores de uma variável em torno de um valor de tendência central tomado como ponto de comparação, podemos dizer que o conjunto X apresenta dispersÃo ou variabilidade nula e que o conjunto Y apresenta uma dispersão ou variabilidade menor que o conjunto Z .

A amplitude total é a diferença entre o maior e o menor valor observado.

AT = x(max.) – x(min.)

AT = x(max.) – x(min.)

Page 36: Apostila de Estatística Básica

Ana Lúcia Guimarães Carvalho

ESTATÍSTICA 36

xi 0 1 2 3 4 fi 2 6 12 7 3

Temos: AT = 4 – 0 = 4 Logo: AT = 4 Com intervalo de classe Neste caso a amplitude total é a diferença entre o limite superior da última classe e o limite inferior da primeira classe:

Considerando a distribuição:

i Estaturas (cm)

fi

1 150 ├ 154 4 2 154 ├ 158 9 3 158 ├162 11 4 162 ├ 166 8 5 166 ├ 170 5 6 170 ├ 174 3 ∑ = 40

temos: AT = 174 – 150 = 24 Logo: AT = 24 cm A amplitude total tem o inconveniente de só levar em conta os dois valores extremos da série, descuidando de valores intermediários, o que quase sempre invalida a idoneidade do resultado. Ela é apenas uma indicação aproximada da dispersão ou variabilidade. Faz-se uso da amplitude total quando se quer determinar a amplitude da temperatura em um dia ou no ano, no controle da qualidade ou como uma medida de cálculo rápido, e quando a compreensão popular é mais importante que a exatidão e a estabilidade. Exercícios:

1) Calcule a amplitude total dos conjuntos de dados: a) 1, 3, 5, 9 b) 20, 14, 15, 19, 21, 22, 20 b) -10, -6, 2, 3, 7, 9, 10 c) 17,9; 22,5; 13,3; 16,8; 15,4; 14,2

2)Calcule a amplitude total das distribuições: a)

xi

2

3

4

5

6

7

8

fi

1

3

5

8

5

4

2

b) CLASSES

1,5├1,6├1,7├1,8├1,9├2,0├ 2,1├ 2,2

fi

4 8 12 15 12 8 4

VARIÂNCIA Uma outra medida que indica o afastamento dos elementos de uma amostra, em relação à média aritmética, é a variância, que se representa por σ2. define-se essa medida como a média aritmética entre os quadrados dos desvios dos elementos da amostra, isto é:

Ou, lembrando que ∑ if = n

DESVIO PADRÃO Na interpretação da variância podem surgir algumas dificuldades em relação à unidade de medida dos elementos da amostra. Por exemplo, se os elementos da amostra representam capacidades em litros ( l ), a variância representará um resultado em l2; como essa unidade não tem significado físico, não é conveniente utilizar a variância nesse

AT = L(max.) – l(mín.)

σ2 =

i

2

i

f

xx

σ2 =

n

xx

2

i∑

Page 37: Apostila de Estatística Básica

Ana Lúcia Guimarães Carvalho

ESTATÍSTICA 37

caso. Por causa de dificuldades como essa, foi criado o desvio padrão, representado por σ, e definido como a raiz quadrada da variância. Dados não-agrupados Tomemos, como exemplo, o conjunto de valores da variável x: 40, 45, 48, 52, 54, 62, 70 O modo mais prático para se obter o desvio padrão é formar uma tabela com duas colunas: Uma para xi e outra para xi

2. Assim:

xi Xi2

40 1.600 45 2.025 48 2.304 52 2.704 54 2.916 62 3.844 70 4.900

∑ = 371 ∑ = 29320.

Como n = 7, temos:

2i

2i

n

x

n

x

−=σ∑∑

=−=

−=σ

22

5389927

371

7

29320.

.

= 48699080928992 ,.. ==− Logo: σ = 9,49 Dados agrupados Sem intervalo de classe Como, neste caso, temos a presença de

freqüências, devemos leva-las em consideração, resultando a fórmula:

Exemplo:

xi fi fix i fix i2

0 2 0 0 1 6 6 6 2 12 24 48 3 7 21 63 4 3 12 48 ∑ = 30 ∑ = 63 ∑ = 165

Logo:

2ii

2ii

n

xf

n

xf

−=σ∑∑

0441091

4145530

63

30

1652

,,

,,

=

=−=

−=σ

Então: σ = 1,04 Com intervalos de classe Começamos por abrir as colunas para x i que é o ponto médio do intervalo de classe. Exemplo: i Estaturas

(cm)

fi xi fixi fixi2

1 150├154 4 152 608 92.416

2 154├158 9 156 1.404 219.024

3 158├162 11 160 1.760 281.600

4 162├166 8 164 1.312 215.168

5 166├170 5 168 840 141.120

6 170├174 3 172 516 88.752

∑= 40 ∑= 4406. ∑ = 0800381 ..

Logo:

2i

2i

n

x

n

x

−=σ∑∑

2ii

2ii

n

xf

n

xf

−=σ∑∑

Page 38: Apostila de Estatística Básica

Ana Lúcia Guimarães Carvalho

ESTATÍSTICA 38

=−=

−=σ 9212595225

40

4406

40

08003812

.....

567531 ,== Então:

σ = 5,57 cm

COEFICIENTE DE VARIAÇÃO

O desvio padrão por si só não nos diz muita coisa. Assim, um desvio padrão de duas unidades pode ser considerado pequeno para uma série de valores cujo valor médio é 200; no entanto, se a média for igual a 20, o mesmo não pode ser dito. Além disso, o fato de o desvio padrão ser expresso na mesma unidade dos dados limita o seu emprego quando desejamos comparar duas ou mais séries de valores, relativamente à sua dispersão ou variabilidade, quando expressas em unidades diferentes. Para contornar essas dificuldades e limitações, podemos caracterizar a dispersão ou variabilidade dos dados em termos relativos a seu valor médio, medida essa denominada coeficiente de variação (CV): Exemplo:

Tomemos os resultados das medidas das estaturas e dos pesos de um mesmo grupo de indivíduos:

x σ

Estaturas 175 cm 5,0 cm Pesos 68 Kg 2,0 Kg

Temos:

CVE = %,, 852100x02850100x175

5==

CVP= %,, 942100x02940100x68

2==

Logo, nesse grupo de indivíduos, os pesos apresentam maior grau de dispersão que as estaturas. Exercícios 1)Sabendo que um conjunto de dados apresenta

para média aritmética e para desvio padrão, respectivamente, 18,3 e 14,7, calcule o coeficiente de variação.

2) Em um exame final de Matemática, o grau

médio de um grupo de 150 alunos foi 7,8 e o desvio padrão, 0,80. Em Estatística, entretanto, o grau médio final foi 7,3 e o desvio padrão de 0,76. Em que disciplina foi maior a dispersão?

3) Medidas as estaturas de 1.017 indivíduos,

obtivemos x =162,2 cm e s=8,01 cm. O peso médio desses mesmos indivíduos é 52 Kg, com um desvio padrão de 2,3 Kg. Esses indivíduos apresentam maior variabilidade em estatura ou peso?

4) Um grupo de cem estudantes tem uma

estatura média de 163,8 cm, com um coeficiente de variação de 3,3%. Qual o desvio padrão desse grupo?

5) Uma distribuição apresenta as seguintes

estatísticas: s=1,5 e CV=2,9%. Determine a média da distribuição.

6) Mostre que os conjuntos 2, 4, 6, 8, 10 e 3, 5,

7, 9, 11 têm o mesmo desvio padrão. Verifique, também, se há alguma relação entre as médias.

7) Num exame de História, duas classes

obtiveram as seguintes médias e desvios: classe A: x = 5,4 s= 2,6 classe B: x = 5,4 s= 3,1 Se for sorteado um aluno em cada classe, em

qual delas é mais provável que a nota desse aluno esteja entre 3,0 e 7,0? Por quê?

8) (Fuvest-SP) Dois atiradores X e Y

obtiveram numa série de vinte tiros, num alvo de forma indicada na figura, os seguintes resultados:

100x

x

CV_

σ=

Page 39: Apostila de Estatística Básica

Ana Lúcia Guimarães Carvalho

ESTATÍSTICA 39

Resultado Atirador 50 30 20 10 0

X 4 6 5 4 1 Y 6 3 5 3 3

Calcule e compare os desvios padrões

de cada uma das séries de tiros e decida qual é o atirador com desempenho mais regular. 9) Para preencher uma vaga de gerente de

produção, o departamento de recursos humanos de uma empresa realizou um teste com vários candidatos, selecionando os dois melhores: Leonor e Felipe. A tabela mostra os desempenhos dos dois candidatos nas provas a que se submeteram:

Candidato Assunto

Felipe

Leonor

Conhecimentos de informática

8,5 9,5

Língua Portuguesa

9,5 9,0

Língua Inglesa 8,0

8,5

Matemática

7,0 8,0

Conhecimentos de Economia

7,0 5,0

Média = 8,0

Média = 8,0

10)(Fuvest-SP, modificado) A distribuição dos salários de uma empresa é dada na seguinte tabela:

Salário em R$ Número de funcionários

500,00 10 1.000,00 5 1.500,00 1 2.000,00 10 5.000,00 4 10.500,00 1

Total 31

a) Qual é a média e qual é a mediana dos salários dessa empresa?

b) Suponha que sejam contratados dois novos funcionários com salários de R$2.000,00 cada. A variância da nova distribuição de salários ficará menor, igual ou maior do que a anterior?

11) O gráfico abaixo mostra a istribuição de

freqüência das notas obtidas pelos alunos da segunda série do ensino médio numa prova de educação física.

0

3

6

9

12

15

18

21

1 2 3 4 5 6 7 8 9 10Nota

me

ro d

e a

lun

os

Determinar:

a) a nota média desses alunos; b) a mediana dessa distribuição; c) a moda dessa distribuição.

PROBABILIDADE

Em condições normais podemos prever a que temperatura o leite ferve. Esse tipo de experimento, cujo resultado é previsível, recebe o nome de determinístico. Mas, ao lançar um dado uma ou mais vezes, não podemos saber com antecedência o número que se vai obter; sabemos apenas que os possíveis resultados são 1, 2, 3, 4, 5 ou 6. Esse tipo de experimento,

50 10 30 20

Os dois candidatos obtiveram a mesma média. Como proceder, cientificamente, para determinar qual dos dois teve o melhor desempenho nessa avaliação?

Page 40: Apostila de Estatística Básica

Ana Lúcia Guimarães Carvalho

ESTATÍSTICA 40

cujo resultado não pode ser previsto, é chamado aleatório. Como exemplos de experimentos aleatórios temos:

• o sorteio de uma loteria de números; • a escolha de um número de 1 a 50; • o sorteio do primeiro prêmio da loteria

federal; • o lançamento de uma moeda.

Na teoria das probabilidades, estudamos

os experimentos aleatórios equiprováveis, ou seja, aqueles em que qualquer resultado pode ocorrer com a mesma chance. É o caso do lançamento de uma moeda: a possibilidade de ocorrer cara ou coroa é a mesma.

ESPAÇO AMOSTRAL A cada experimento correspondem, em geral, vários resultados possíveis. Assim, ao lançarmos uma moeda, há dois resultados possíveis: ocorrer cara ou ocorrer coroa. Já ao lançarmos um dado há seis resultados possíveis: 1, 2, 3, 4, 5, ou 6. Ao conjunto desses resultados possíveis damos o nome de espaço amostral ou conjunto universo, representado por S. O número de elemento desse conjunto é indicado por n(S). Os dois experimentos citados anteriormente têm os seguintes espaços amostrais: • lançamento de uma moeda S = { Ca, Ko} • lançamento de um dado S={1,2, 3, 4, 5, 6} • lançamento de duas moedas

S = {(Ca,Ko); (Ca,Ca); (Ko,Ca); (Ko,Ko)} Cada um dos elementos de S que corresponde a um resultado recebe o nome de ponto amostral.

EVENTOS Chamamos de evento qualquer subconjunto do espaço amostral S de um experimento aleatório. Assim, qualquer que seja E, se E ⊂ S (E está contido em S), então E é um evento de S. Se E=S, E é chamado evento certo;

Se E ⊂ S e E é um conjunto unitário, E é

chamado evento elementar;

Se E = ∅∅∅∅, E é chamado evento

impossível.

Exemplo: No lançamento de um dado, onde S={1,2,3,4,5,6},

• obter um número par na face superior A = {2,4,6} A ⊂ S; logo, A é um evento de S. • obter um número menor ou igual a 6 na

face superior B = {1,2,3,4,5,6} B ⊂ S; logo, B é um evento certo de S (B = S). • obter o número 4 na face superior C = {4} C ⊂ S; logo, C é um evento elementar de S. • obter um número maior que 6 na face

superior D = ∅ logo, D é um evento impossível de S

Exercícios 1) Determine o espaço amostral do experimento

aleatório “lançamento simultâneo de duas moedas”.

2) considerando o experimento aleatório

“nascimento de três filhos de um casal”, determine o espaço amostral e o subconjunto que representa o evento nascimento de exatamente dois meninos em três filhos do casal.

3) No lançamento de um dado, determine o

evento para obter: a) um número maior que 4.

Experimentos ou fenômenos aleatórios são aqueles que, mesmo repetidos várias vezes sob condições semelhantes, apresentam resultados imprevisíveis.

Page 41: Apostila de Estatística Básica

Ana Lúcia Guimarães Carvalho

ESTATÍSTICA 41

b) Um número primo 4) Considerando o experimento “sorteio de

um número de 1 a 20”, determine o evento para obter um número:

a) múltipla de 3. b) múltiplo de 5. c) Primo

5) No lançamento simultâneo de dois dados

diferentes, determine os seguintes eventos: a) números iguais nos dois dados; b) números cuja soma seja 2; c) números cuja soma seja 7; d) números cuja soma seja 13.

Probabilidade Dado um experimento aleatório, sendo S o seu espaço amostral, vamos admitir que todos os elementos de S tenham a mesma chance de acontecer, ou seja, que S é um conjunto equiprovável. Chamamos de probabilidade de um evento A (A ⊂ S) o número real P(A), tal que:

onde: n(A) é o número de elementos de A n(S) é o número de elementos de S Exemplos: 1) Lançamento de uma moeda e o evento

obter cara. S = {Ca, Ko} E = {Ca} n(S) = 2 n(E) = 1

logo: )(

)()(

Sn

AnAP = =

2

1 = 50%

2) Lançamento de um dado, calcular: a) obter um número primo S = {1,2,3,4,5,6} E = {2,3,5} n(S) = 6 n(E) = 3

2

1

6

3AP ==)(

b) obter um número par na face superior

S = {1,2,3,4,5,6} E = {2,4,6} n(S) = 6 n(E) = 3

2

1

6

3BP ==)(

c) obter um número menor ou igual a 6 na face

superior S = {1,2,3,4,5,6} E = {1,2,3,4,5,6} n(S) = 6 n(E) = 6

16

6CP ==)(

d) obter um número maior que 6 na face

superior S = {1,2,3,4,5,6} E = ∅ n(S) = 6 n(E) = 0

06

0DP ==)(

Propriedades 1ª) Se E = ∅∅∅∅, então n(E) = 0 e, portanto,

P(E)=0 ( probabilidade do evento impossível).

2ª) Se E = S, então n(E) = n(S) e P(E) = 1

(probabilidade do evento certo). 3ª) Se E ⊂⊂⊂⊂ S, então 0 ≤ n(E) ≤ n(S) 0 ≤ P(E) ≤ 1 4ª) Se A é conjunto unitário, então n(E) = 1

(evento elementar E qualquer) n

1EP =)(

Exercícios: 1) Na escolha de um número de 1 a 30, qual a

probabilidade de que seja sorteado um múltiplo de 5?

2) Qual a probabilidade de, no lançamneto

simultâneo de dois dados diferentes, obter soma igual a 7?

3) Qual a probabilidade de sair o ás de ouro

quando retiramos uma carta de um baralho de 52 cartas?

)(

)()(

Sn

AnAP =

Page 42: Apostila de Estatística Básica

Ana Lúcia Guimarães Carvalho

ESTATÍSTICA 42

4) Qual a probabilidade de sair um rei quando

retiramos uma carta de um baralho de52 cartas?

5) Uma urna contém 10 bolas brancas, 8

vermelhas e 6 pretas, todas iguais e indistinguíveis ao tato. Retirando-se uma bola ao acaso, qual a probabilidade de ela não ser preta?

6) a probabilidade de você ganhar uma

bicicleta numa rifa de 100 números da qual você comprou quatro números é:

a) 5

2 b)

10

1 c)

25

1

d) 30

1 e)

50

1

Eventos Complementares Sabemos que um evento pode ocorrer ou não. Sendo p a probabilidade de que ele ocorra (sucesso) e q a probabilidade de que ele não ocorra (insucesso), para um evento existe sempre a relação:

Assim, se a probabilidade de se

realizar um evento é p = 5

1, a probabilidade de

que ele não ocorra é:

q = 1 – p q = 1 – 5

1 =

5

4

Exemplo: Sabemos que a probabilidade de tirar 4

no lançamento de um dado é p = 6

1. Logo, a

probabilidade de não tirar o 4 no lançamento de um dado é

q = 1 - 6

5

6

1=

Eventos Independentes

Dizemos que dois eventos são independentes quando a realização ou a não realização de um dos eventos não afeta a probabilidade do outro e vice-versa. Exemplo: Quando lançamos dois dados, o resultado obtido em um deles independe do resultado obtido no outro. Se dois eventos são independentes, a probabilidade de que eles se realizem simultaneamente é igual ao produto das probabilidade de realização dos dois eventos. Assim, sendo p1 a probabilidade de realização do primeiro evento e p2 a probabilidade de realização do segundo evento, a probabilidade de que tais eventos se realizem simultaneamente é dada por: Exemplo: Lançamos dois dados. A probabilidade

de obtermos 1 no primeiro dados é p1 = 6

1

A probabilidade de obtermos 5 no

segundo dado é p2 = 6

1

Logo, a probabilidade de obtermos, simultaneamente , 1 no primeiro e 5 no

segundo é 36

1

6

1x

6

1p ==

Eventos Mutuamente Exclusivos Dizemos que dois ou mais eventos são mutuamente exclusivos quando a realização de um exclui a realização do(s) outro(s). Assim, no lançamento de uma moeda, o evento “tirar cara”e o evento “tirar coroa”são mutuamente exclusivos, já que, ao se realizar um deles, o outro não se realiza. Se dois eventos são mutuamente exclusivos, a probabilidade de que um ou outro se realize é igual à soma das probabilidades de que cada um deles se realize.

p + q = 1 q = 1 - p

p = p1 x p2

Page 43: Apostila de Estatística Básica

Ana Lúcia Guimarães Carvalho

ESTATÍSTICA 43

Exemplo: Lançamos um dado. A probabilidade de se tirar o 3 ou o 5 é

3

1

6

2

6

1

6

1p ==+=

pois como vimos, os dois eventos são mutuamente exclusivos. Exercícios: 1) No lançamento de dois dados, calcule a

probabilidade de se obter soma igual a 5. 2) Determine a probabilidade de cada

evento: a) Um número par aparece no lançamento de um dado. b) Uma só coroa aparece no lançamento de três moedas.

3) Dois dados são lançados

simultaneamente. Determine a probabilidade de: a) A soma ser menor que 4. b) A soma ser 9. c) O primeiro resultado ser maior que o segundo. d) A soma ser menor ou igual a 5.

4) Um inteiro entre 3 e 11 será escolhido ao

acaso. a) Qual é a probabilidade de que este número seja ímpar? b) Qual é a probabilidade de que este número seja ímpar e divisível por 3?

5) No lançamento de dois dados, qual é a

probabilidade de se obter um par de pontos iguais?

6) Um casal planeja ter três filhos.

Determine a probabilidade de nascerem: a) Três homens. b) Dois homens e uma mulher.

7) Uma moeda é lançada três vezes. Calcule

a probabilidade de obtermos: a) três caras. b) Duas caras e uma coroa

c) Uma cara somente. d) Nenhuma cara. e) Pelo menos uma cara. f) No máximo uma cara.

8) Um dado é lançado duas vezes. Calcule a

probabilidade de: a) sair um 6 no primeiro lançamento. b) Sair um 6 no segundo lançamento. c) Não sair 6 em nenhum lançamento. d) Sair um 6 pelo menos.

9) Uma urna contém 50 bolas idênticas.

Sendo as bolas numeradas de 1 a 50, determine a probabilidade de, em uma extração ao acaso: a) obtermos a bola de número 27. b) Obtermos uma bola de número par. c) Obtermos uma bola de número maior que 20. d) Obtermos uma bola de número menor ou igual a 20.

10) Um par de dados é atirado. Encontre a

probabilidade de que a soma seja 10 ou maior que 10 se: a) um 5 aparece no primeiro dado. b) um 5 aparece pelo menos em um dado.

11) Lança-se um par de dados. Aparecendo

dois números diferentes, encontre a probabilidade de que: a) a soma seja 6. b) O 1 apareça. c) A soma seja 4 ou menor que 4.

12) Um lote é formado por 10 peças boas, 4

com defeitos e 2 com defeitos graves. Uma peça é escolhida ao acaso. Calcule a probabilidade de que: a) ela não tenha defeitos graves. b) Ela não tenha defeitos c) Ela seja boa ou tenha defeitos graves.

13) Uma urna A contém: 3 bolas brancas, 4

pretas, 2 verdes; uma urna B contém: 5 bolas brancas, 2 pretas, 1 verde; uma urna C contém:2 bolas brancas, 3 pretas, 4 verdes. Uma bola é retirada de cada urna. Qual é a probabilidade de as três bolas retiradas da primeira, Segunda e terceira

p = p1 + p2

Page 44: Apostila de Estatística Básica

Ana Lúcia Guimarães Carvalho

ESTATÍSTICA 44

urnas serem, respectivamente, branca, preta e verde?

14) No lançamento de um dado, qual a

probabilidade de se obter um número não-inferior a 5?

15) Dois dados são lançados conjuntamente.

Determine a probabilidade de a soma ser 10 ou maior que 10.

16) Uma moeda é lançada duas vezes. Calcule

a probabilidade de: a) Não ocorrer cara nenhuma vez. b) Obter-se cara na primeira ou na Segunda jogada.

17) Em um lote de 12 peças, 4 são

defeituosas. Sendo retiradas aleatoriamente e sem reposição 2 peças, calcule: a) A probabilidade de ambas serem defeituosa. b) A probabilidade de ambas não serem defeituosas. c) A probabilidade de ao menos uma ser defeituosa.

18) No lançamento de um dado, qual é a

probabilidade de sair o número 6 ou um número ímpar?

19) Uma loja dispõe de 12 geladeiras do

mesmo tipo, das quais 4 apresentam defeitos. a) Se um freguês vai comprar uma geladeira, qual a probabilidade de levar uma defeituosa? b) Se um freguês vai comprar duas geladeiras, qual a probabilidade de levar duas defeituosas? c) Se um freguês vai comprar duas geladeiras, qual a probabilidade de levar pelo menos uma defeituosa?

20) Um lote é formado por 10 peças boas, 4

com defeitos e duas com defeitos graves. Retiram-se duas peças ao acaso. Calcule a probabilidade de que: a) ambas sejam perfeitas. b) Pelo menos uma seja perfeita. c) Nenhuma tenha defeitos graves.

d) Nenhuma seja perfeita. 21) Você acabou de achar a raspadinha no

pacote de Doritos. Com base na figura abaixo calcule a probabilidade de achar a carinha.

a)

22) Qual a probabilidade de um apostador acertar na sena do jogo mega sena, com uma única aposta de 6 dezenas? Sabe-se que sorteiam 6 dezenas em 60.

23) Qual a probabilidade de um apostador

acertar na sena do jogo super sena, com 6 apostas de 6 dezenas? Sabe-se que sorteiam 6 dezenas em 48.

DISTRIBUIÇÃO DE PROBABILIDADE Consideremos a distribuição de freqüência relativa ao número de acidentes diários em um estacionamento:

Nº de Acidentes Freqüência

0 22

1 5

2 2

3 1

Σ = 30

Em um dia, a probabilidade de:

• não ocorrer acidentes é:

73030

22p ,==

• ocorrer um acidente é:

PERDEU

PERDEU

PERDEU

PERDEU

PERDEU

INÍCIO

Page 45: Apostila de Estatística Básica

Ana Lúcia Guimarães Carvalho

ESTATÍSTICA 45

17030

5p ,==

• ocorrerem dois acidentes é:

07030

2p ,==

• ocorrerem três acidentes é:

03030

1p ,==

Podemos, então, escrever:

Nº de acidentes Probabilidade

0 30

22 = 0,73

1 30

5 = 0,17

2 30

2 = 0,07

3 30

1 = 0,03

Σ = 1,00

Essa tabela é denominada distribuição de probabilidade. Exemplo: Determine a distribuição de probabilidade para o lançamento simultâneo de duas moedas e a probabilidade de obtermos número de caras. Ponto Amostral Nº de Caras Probabilidade

(Ca, Ca) 2 4

12

12

1 =⋅

(Ca, Ko) 1 4

12

12

1 =⋅

(Ko,Ca) 1 4

12

12

1 =⋅

(Ko,Ko) 0 4

12

12

1 =⋅

Ca Ko

Ca Ca Ko Ca Ko Ko

Nº de Caras Probabilidade ( P(x) )

2 4

1 = 0,25

1 4

2 = 0,5

0 4

1 = 0,25

4

4 Σ = 1

Ao lançarmos um dado, sendo a variável aleatória x definida por “pontos de um dado”. Faça uma tabela de distribuição de probabilidade para cada um dos resultados do dado. Assim, ao lançarmos um dado a variável aleatória x, definida por “pontos de um dado”pode tomar os valores 1, 2, 3, 4, ,5, 6. Como cada um desses valores está associado uma só probabilidade de realização e ΣP(xi) = 1, fica definida então uma função de probabilidade da qual resulta a distribuição de probabilidade:

x P(x)

1 6

1

2 6

1

3 6

1

4 6

1

5 6

1

6 6

1

Σ = 1 A função da probabilidade é representada por: A função P(x=xi), determina a distribuição de probabilidade da variável aleatória x. Exercícios: 1) Efetue a distribuição de probabilidade do

lançamento de 2 dados e a probabilidade para a soma dos resultados

f(x) = P(x=xi)

Page 46: Apostila de Estatística Básica

Ana Lúcia Guimarães Carvalho

ESTATÍSTICA 46

2) Construir o gráfico de pares para o lançamento de 3 moedas ( x i = nº de coroas) a) Qual a probabilidade de saírem 2

coroas? b) Qual a probabilidade de saírem 2 ou

mais coroas? DISTRIBUIÇÃO BINOMIAL Termo Geral 1) O experimento deve ser repetido nas mesmas condições, num número finito de vezes (n) . 2) As provas repetidas devem ser independentes, ou seja, o resultado de uma não deve afetar os resultados das sucessivas. 3) Em cada prova deve aparecer um dos dois possíveis resultados: sucesso e insucesso. 4) No decorrer do experimento a probabilidade p (sucesso) e a probabilidade q (insucesso) somados tem que ser igual a 1 (q=1- p) Suponhamos, que realizemos a mesma prova n vezes sucessivas e independentes. A probabilidade de que um evento se realize k vezes nas provas é dada pela função: na qual: P(X = k) é a probabilidade de que o evento se realize k vezes em n provas; p é a probabilidade de que o evento se realize em uma só prova – sucesso; q é a probabilidade de que o evento não se realize no decurso dessa prova – insucesso;

k

n é o coeficiente binomial de n

sobre k, igual a )!(!

!

knkn−−−−

n é o número de vezes que repete a prova; k número de vezes que repete o evento. Exemplo: 1)Uma moeda é lançada 5 vezes seguidas e

independentes. Calcule a probabilidade de serem obtidas 3 caras nessas 5 provas.

Temos: n = 5 e k = 3

P(X=3) =

3

5p3q5-3 =

3

5p3q2

Se a probabilidade de obtermos “cara”numa só

prova (sucesso) é p=2

1 e a probabilidade de

não obtermos “cara”numa só prova (insucesso)

é q=1 - 2

1 =

2

1, então:

16

5

4

1x

8

1x

1x2x1x2x3

1x2x3x4x5

4

1x

8

1x

23

5

2

1

2

1

3

53XP

23

==

==

==

!!

!)(

Logo:

P(X=3) = 16

5

2) Dois times de futebol, A e B, jogam entre si

6 vezes. Encontre a probabilidade de o time A ganhar 4 jogos.

n = 6, k = 4, p = 3

1, q = 1 -

3

1 =

3

2

243

20

9

4x

81

1x15

3

2

3

1

4

64XP

24

==

== )(

Logo:

P(X = 4) = 243

20 = 0,08

Exercícios: 1) Um atirados acerta o alvo 3 vezes em uma

bateria de 5 tiros. Se ele participar de 7 baterias, qual a probabilidade dele acertar o alvo?

knk qpk

nkXPXf −

=== )()(

Page 47: Apostila de Estatística Básica

Ana Lúcia Guimarães Carvalho

ESTATÍSTICA 47

2) Jogando um dado 4 vezes, qual a

probabilidade de sair o número 5 exatamente 3 vezes?

3) Uma prova consta de 6 questões com 4

opções cada uma, com uma única alternativa correta. Qual a probabilidade de acertar 2 das 6 questões?

4) Uma urna contém 3 bolas azuis e 2

brancas. Retira-se uma bola ao acaso, observando-se sua cor e recoloca-se a bola na urna. Se esse experimento for realizado 5 vezes sucessivas, qual é a probabilidade de se obterem exatamente 3 bolas azuis?

5) Por meio de estudos genéticos, um casal

descobre que a probabilidade de que eles venham a ter um filho de olhos azuis é

igual a 4

1 . Se o casal pretende ter 6

filhos, qual é a probabilidade de que exatamente 2 tenham olhos azuis?

6) Jogando-se um dado três vezes, determine

a probabilidade de se obterem um múltiplo de 3 duas vezes.

7) dois times de futebol, A e B, jogam entre si

6 vezes. Encontre a probabilidade de o time A ganhar dois ou três jogos.

8) A probabilidade de um atirados acertar o

alvo é 3

2 . Se ele atirar 5 vezes, qual a

probabilidade de acertar exatamente 2 tiros?

9) Seis parafusos são escolhidos ao acaso da

produção de certa máquina, que apresenta 10% de peças defeituosas. Qual a probabilidade de serem defeituosos dois deles?

10) Jogando uma moeda 3 vezes, determine a

probabilidade de obter: a) coroa nas 3 vezes; b) coroa 2 vezes;

11) Determine a probabilidade de ocorrerem 3

números 4 em 5 lances de um dado.

12) Calcule a probabilidade de obter exatamente 3 coroas e 2 caras em 5 lances de uma moeda.

13) Em um campeonato de tênis, o jogados A

tem 0,4 de probabilidade de ganhar uma partida, o jogador B tem 0,3 e o jogador C tem 0,3. Sabendo que o torneio consta de 3 partidas, determine a probabilidade de:

a) B ganhar as 3 partidas; b) A ganhar as 3 partidas; c) A ganhar 2 partidas; d) C ganhar 2 partidas.

14) (Cesgranrio-RJ) Três moedas são lançadas

simultaneamente. A probabilidade de obter 2 caras e 1 coroa é de:

a) 8

1 b)

4

1 c)

16

5 d)

8

3 e)

2

1

15) A probabilidade de um atirados acertar um

alvo em um único tiro é 0,2. Dando 4 tiros calcular a probabilidade de :

a) acertar o alvo duas vezes; b) não acertar o alvo.

16) Em cirurgias de miopia, sabe-se que 10%

não obtêm sucesso. Qual é a probabilidade de que, em 4 cirurgias, 3 obtenham sucesso?

17) Um casal quer ter 5 filhos. Qual é a

probabilidade de que:

a) todos sejam homens? b) Tenham 2 meninas?

18) Qual é a maior probabilidade: A: de sair 50% de caras num lançamento de 8

moedas, ou B: de sair 50% de caras num lançamneto de 12

moedas? DISTRIBUIÇÃO NORMAL CURVA NORMAL Em nosso dia a dia podemos observar que alguns fatos têm probabilidade de ocorrer com maior freqüência que outros.

Page 48: Apostila de Estatística Básica

Ana Lúcia Guimarães Carvalho

ESTATÍSTICA 48

Uma pessoa muito alta, acima de 2,10m, por exemplo, andando na rua, desperta a nossa curiosidade, evidentemente porque não é tão comum assim alguém com tanta altura. Entretanto, as pessoas adultas, na faixa de 1,60m a 1,80m, podem ultrapassar-nos às milhares pelas ruas, sem que nos fixemos em alguma delas pela sua estatura. Logo, a altura das pessoas, assim como as suas idades ou a média bimestral dos alunos de uma escola, entre outras distribuições encontradas na natureza, são exemplos de distribuição normal, onde cada evento possui freqüência diferente dentro do universo, variáveis de acordo com a forma gráfica: Propriedades de uma Distribuição Normal

1º) A variável aleatória X pode assumir todo e qualquer valor real. 2º) A representação gráfica da distribuição normal é uma curva em forma de sino, simétrica em torno da média (x ), que recebe o nome de curva normal ou de Gauss. 3º) A área total limitada pela curva e pelo eixo das abscissas é igual a 1, já que essa área corresponde à probabilidade de a variável aleatória X assumir qualquer valor real. 4º) A curva normal é assintótica em relação ao eixo das abscissas, isto é, aproxima-se indefinidamente do eixo das abscissas sem, contudo, alcança-lo. 5º) Como a curva é simétrica em torno de x, a probabilidade de ocorrer valor maior do que a média é igual à probabilidade de ocorrer valor menor do que a média, isto é, ambas as probabilidades são iguais a 0,5. Escrevemos:

50xXPxXP ,)()( =<=>

Quando temos em mãos uma variável aleatória com distribuição normal, nosso principal interesse é obter a probabilidade de essa variável aleatória assumir um valor em um determinado intervalo. Exemplo: Seja X a variável aleatória que representa os diâmetros dos parafusos produzidos por certa máquina. Vamos supor que essa variável tenha distribuição normal com média x =2cm e desvio padrão s=0,04cm. Pode haver interesse em conhecer a probabilidade de um parafuso ter um diâmetro com valor entre 2 e 2,05cm. É fácil notar que essa probabilidade é indicada por: P( 2 < X < 2,05 ) que corresponde à área hachurada da figura: Para o cálculo direto dessa probabilidade, podemos dizer que se X é uma variável aleatória com distribuição normal de média x e desvio padrão s, então existe uma variável z que tem distribuição normal reduzida, isto é, tem distribuição normal de média 0 e desvio padrão 1, dada por:

s

xxZ

−=

Queremos calcular P(2 < X < 2,05). Para obter essa probabilidade, precisamos, em primeiro lugar, calcular o valor de z que corresponde a x1 = 2,05 e x2 = 2.

Z = s

xx −

040

22Z

,

−= Z= 0

s

xxZ

−=

040

2052Z

,

, −=

040

050Z

,

,= Z = 1,25

então: P( 2 < X < 2,05 ) = P( 0 < Z < 1,25 )

Freqüência

Eventos

2 2,05

Page 49: Apostila de Estatística Básica

Ana Lúcia Guimarães Carvalho

ESTATÍSTICA 49

Exercícios: 1) Uma variável x tem distribuição normal

com média 200u e desvio padrão de 40u. Determine aos valores de Z para os

seguintes valores de x

a) (180 < X < 220)

b) (X ≥ 205)

c) (193 < X < 194)

d) ( X ≤ 200)

e) ( X < 210)

2) Utilizando a tabela de Distribuição Normal

determine as probabilidades:

a) P(-1,25 < Z < 0)

b) P(-0,5 < Z < 1,48)

c) P(0,8 < Z < 1,23)

d) P(Z > 0,6)

e) P(Z < 0,92)

3) Os salários dos operários industriais são distribuídos normalmente, em torno da média de R$1.000,00, com desvio padrão de R$800,00. Calcule a probabilidade de um operário ter um salário situado entre R$800,00 e R$1.400,00.

4) Sendo Z uma variável com distribuição

normal reduzida, calcule:

a) P(0 < Z < 1,44) b) b) P(-0,85 < Z < 0) c) P(-1,48 < Z < 2,05) d) P(0,72 < Z < 1,89) e) P(Z > -2,03) f) f) P(Z > 1,08) g) P(Z < -0,66) h) h) P(Z < 0,60)

5) Um teste padronizado de escolaridade tem

distribuição normal com média 100 e desvio padrão 10. Determine a probabilidade de um indivíduo submetido ao teste ter nota:

a) maior que 120;

b) maior que 80; c) entre 85 e 115; d) maior que 100.

6) Os pesos de 600 estudantes são

normalmente distribuídos com média 65,3 Kg e desvio padrão 5,5 Kg. Determine o número de estudantes que pesam:

a) entre 60 e 70 Kg; b) mais que 63,2 Kg; c) menos que 68 Kg.

7) A duração de um certo componente

eletrônico tem média de 850 dias e desvio padrão de 40 dias. Sabendo que a duração é normalmente distribuída, calcule a probabilidade de esse componente durar:

a) entre 700 e 1000 dias; b) mais de 800 dias; c) menos de 750 dias.

8) Ao anotar a velocidade de uma série de

motoristas que passavam por determinado ponto da estrada, a polícia chegou à conclusão de que a velocidade média naquele ponto era de 65 km/h, com um desvio padrão de 9 km/h. Verificou-se também que a distribuição das velocidades podia ser considerada uma normal. Assim sendo, pede-se:

a) Determinar a probabilidade de que o

próximo carro a passar pelo referido ponto da estrada tenha velocidade maior que 80 km/h.

b) Determinar a probabilidade de que o próximo carro a passar pelo mesmo ponto tenha velocidade entre 70 e 75 km/h.

c) Calcular a porcentagem dos carros que, num determinado dia, serão multados ou advertidos, sabendo-se que serão multados os carros com velocidades superiores a 85 km/h e serão advertidos os carros com velocidades entre 75 km/h e 85 km/h.

9) A altura média dos rapazes que se inscrevem

para o serviço militar é 1,67 m, com desvio padrão de 15 cm. Sabendo-se que o Exército somente aceita para o serviço militar rapazes com altura entre 1,55 m e 1,92 m,

Page 50: Apostila de Estatística Básica

Ana Lúcia Guimarães Carvalho

ESTATÍSTICA 50

qual a porcentagem de rapazes que não servirão o Exército?

CORRELAÇÃO E REGRESSÃO Até agora analisamos os cálculos estatísticos associados a uma única variável; como o peso das pessoas, o diâmetro das esferas ou o consumo de energia elétrica. Sabemos, entretanto, que muitas variáveis mantêm dependências entre si, no sentido de que o crescimento de uma delas também pode causar o crescimento em outra. Vejamos alguns casos:

• O preço dos aluguéis dos imóveis e a sua área.

• Os índices pluviométricos e a fertilidade dos solos.

• A temperatura ambiente e o consumo de cerveja.

Há, sem dúvida, um número muito grande de pares de variável dependentes entre si, sendo o nosso trabalho, no momento, encontrar uma maneira de dimensionar essa interdependência, principalmente quando não conhecemos os fatores que interferem em uma ou em outra. Ao grau de dependência entre duas variáveis denominamos correlação, e, deste modo, podemos esperar que certas variáveis, como por exemplo, “quantidade de tinta”e “área da parede”, tenham uma alta correlação, enquanto “área da parede”e “idade do pintor”, por outro lado, apresentam quase nenhuma correlação. Assim, quando consideramos variáveis como peso e altura de um grupo de pessoas, uso do cigarro e incidência do câncer, vocabulário e compreensão da leitura, procuramos verificar se existe alguma relação entre as variáveis de cada um dos pares e qual o grau dessa relação. Para isso é necessário o conhecimento de novas medidas. Sendo a relação entre as variáveis de natureza quantitativa, a correlação é o instrumento adequado para descobrir e medir essa relação. Uma vez caracterizada a relação, procuramos descreve-la através de uma função matemática. A regressão é o instrumento adequado para a determinação dos parâmetros dessa função.

CORRELAÇÃO Relação Funcional e Relação Estatística Como sabemos, o perímetro e o lado de um quadrado estão relacionados. A relação que os liga é perfeitamente definida e pode ser expressa por meio de uma sentença matemática: 2p = 4l onde 2p é o perímetro e l é o lado. Atribuindo-se, então, um valor qualquer a l, é possível determinar exatamente o valor de 2p. Consideremos, agora, a relação que existe entre o peso e a altura de um grupo de pessoas. É evidente que esta relação não é do mesmo tipo da anterior; ela é bem menos precisa. Assim, pode acontecer que a estaturas diferentes correspondam pesos iguais ou que a estaturas iguais correspondam pesos diferentes. Porém, em média, quanto maior a estatura, maior o peso. Quando duas variáveis estão ligadas por uma relação estatística, dizemos que existe correlação entre elas. Diagrama de Dispersão Após dispormos de uma série de valores de duas variáveis que estamos querendo verificar se entre elas há ou não um certo grau de dependência, o primeiro passo será marca-las num gráfico cartesiano, cada uma das séries num dos eixos, construindo, assim, o que se conhece por diagrama de dispersão. A observação do diagrama de dispersão das variáveis será o primeiro passo para avaliarmos a correlação. Suponhamos, por exemplo, o gráfico de dispersão das variáveis mostradas na tabela abaixo:

X Y X Y

As relações do tipo perímetro–lado são conhecidas como relações funcionais e as do tipo peso-estatura, como relações estatísticas.

Page 51: Apostila de Estatística Básica

Ana Lúcia Guimarães Carvalho

ESTATÍSTICA 51

25 12 36 9 26 11 37 7 27 13 38 7 28 12 39 6 29 11 40 6 30 8 41 4 31 10 42 5 32 9 43 5 33 7 44 5 34 8 45 5 35 8

Imaginemos que os valores da variável X sejam as idades das pessoas de determinada classe e os valores de Y, o tempo médio de duração do banho diário de todas as pessoas entrevistadas em cada idade. A marcação dos pares ordenados (X,Y) no plano cartesiano levará, por fim, ao diagrama de dispersão mostrado abaixo:

0

2

4

6

8

10

12

14

24 26 28 30 32 34 36 38 40 42 44 46 48Idade

Te

mp

o

A configuração mostrada no gráfico nos faz supor que existe uma certa correlação entre duas variáveis, ou seja, com a passagem do tempo, as pessoas parecem demorar-se menos debaixo do chuveiro. Devemos, entretanto, tomar o cuidado na análise de correlação, uma vez que as variáveis correlacionadas não necessariamente estão sujeitas a uma relação de causa e efeito. No nosso exemplo, não podemos afirmar com certeza que as pessoas se banham mais rapidamente apenas porque são mais idosas, já que o motivo da rapidez pode ser outro que não a idade, como por exemplo o fato de as pessoas tornarem-se menos vaidosas ou mais ocupadas conforme o tempo vai passando. A correlação, portanto, apontará em muitos casos unicamente a existência de variações semelhantes em duas variáveis, sem que, entretanto, uma tenha muita coisa a ver com a outra.

A observação pura e simples dos diagramas de dispersão pode nos fornecer uma série de informações:

Exercícios 1) Consideremos uma amostra aleatória,

formada por dez dos 98 alunos de uma classe da faculdade A e pelas notas obtidas por eles em Matemática e Estatística.

Notas

y

x

Correlação linear positiva Aumenta x, aumenta y

y

x

Correlação linear negativa Aumenta x, diminui y

x

y Correlação não-linear Distribuição dos pontos em torno de uma curva

y

x

Correlação nula Aumenta x, varia y ao acaso Não há correlação

Page 52: Apostila de Estatística Básica

Ana Lúcia Guimarães Carvalho

ESTATÍSTICA 52

Nº Matemática (xi)

Estatística (yi)

01 5.0 6.0 08 8.0 9.0 24 7.0 8.0 38 10.0 10.0 44 6.0 5.0 58 7.0 7.0 59 9.0 8.0 72 3.0 4.0 80 8.0 6.0 92 2.0 2.0

Construa o diagrama de dispersão. Correlação Linear Observando o exercício anterior, podemos imaginar que, quanto mais fina for a elipse, mais ela se aproximará de uma reta. Dizemos, então, que a correlação de forma elíptica tem como “imagem” uma reta, sendo, por isso, denominada correlação linear. É possível verificar que a cada correlação está associada como “imagem” uma relação funcional. Por esse motivo, as relações funcionais são chamadas relações perfeitas. Como a correlação em estudo tem como “imagem” uma reta ascendente, ela é chamada correlação linear positiva. Assim, uma correlação é: a) linear positiva se os pontos do diagrama têm como “imagem” uma reta ascendente; b) linear negativa se os pontos têm como “imagem” uma reta descendente; c) não-linear se os pontos têm como “imagem” uma curva. Se os pontos apresentam-se dispersos, não oferecendo uma “imagem” definida, concluímos que não há relação alguma entre as variáveis em estudo.

Coeficiente de Correlação Linear O instrumento empregado para a medida da correlação linear é o coeficiente de correlação. Este coeficiente deve indicar o grau de intensidade da correlação entre duas variáveis

e, ainda, o sentido dessa correlação (positivo ou negativo). Faremos uso do coeficiente de correlação de Pearson, que é dado por:

( )( )

( ) ( )

−=

∑ ∑∑ ∑

∑∑ ∑2

i2i

2i

2i

iiii

yynxxn

yxyxnr

onde n é o número de observações. Os valores limites de r são –1 e +1. isto é, o valor de r pertence ao intervalo [-1,+1]. Assim: a) se a correlação entre duas variáveis é

perfeita e positiva, então r = +1`; b) se a correlação é perfeita e negativa, então

r = -1; c) se não há correlação entre as variáveis,

então r = 0. Logicamente: a) se r = +1, há uma correlação perfeita e

positiva entre as variáveis; b) se r = -1, há uma correlação perfeita e

negativa entre as variáveis; c) se r = 0, ou não há correlação entre as

variáveis, ou a relação que porventura exista não é linear.

OBS: Para podermos tirar algumas conclusões significativas sobre o comportamento simultâneo das variáveis analisadas, é necessário que:

1r60 ≤≤,

Se 60r30 ,, <≤ , há uma correlação

relativamente fraca entre as variáveis. Se 30r0 ,<< , a correlação é muito

fraca e, praticamente, nada podemos concluir sobre a relação entre as variáveis em estudo.

Page 53: Apostila de Estatística Básica

Ana Lúcia Guimarães Carvalho

ESTATÍSTICA 53

Vamos então calcular o coeficiente de correlação do exercício anterior. O modo mais rápido para obtermos r é abrir, na tabela, colunas correspondentes aos valores de xiy i, xi

2 e y i2.

Notas

Nº Matem.

(xi)

Estat.

(yi)

xiyi xi2 yi

2

01 5.0 6.0 30 25 36

08 8.0 9.0 72 64 81

24 7.0 8.0 56 49 64

38 10.0 10.0 100 100 100

44 6.0 5.0 30 36 25

58 7.0 7.0 49 49 49

59 9.0 8.0 72 81 64

72 3.0 4.0 12 9 16

80 8.0 6.0 48 64 36

92 2.0 2.0 4 4 4

Σxi=65 Σyi=65 Σxiyi=473 Σxi2=481 Σyi

2=475

( )( )

( ) ( )

−=

∑ ∑∑ ∑

∑∑ ∑2

i2i

2

i2i

iiii

yynxxn

yxyxnr

( )( )

( ) ( )[ ] ( ) ( )[ ]22 65475106548110

656547310r

−−

−=

..

..

910r525585

505r ,

.==

Resultado que indica uma correlação linear positiva altamente significativa entre as duas variáveis. Exercícios: 1) Calcule o coeficiente de correlação para os

valores das variáveis xi e yi.

xi 4 6 8 10 12 yi 12 10 8 12 14

2) determine o coeficiente de correlação linear

para os dados dos conjuntos abaixo,

construindo também o diagrama de dispersão.

a) x 2 3 9 8 6 10 y 1,6 1,2 1,0 1,2 1,4 1,0

b)

x 0 1 2 3 4 5 6 y 3 18 21 40 34 61 65

3) Numa indústria é feito um acompanhamento

sistemático do percentual de elementos defeituosos produzidos a cada intervalo de meia hora. Após um mês de produção, os valores médios de percentuais de defeitos a cada horário foram marcados na tabela:

Horas % Horas % 7:00 0,12 10:00 0,13 7:30 0,09 10:30 0,18 8:00 0,14 11:00 0,15 8:30 0,19 11:30 0,19 9:00 0,14 12:00 0,20 9:30 0,16

Verifique a existência de correlação linear entre o horário e o percentual de defeitos. 4) Calcule o coeficiente de correlação linear do

conjunto de pontos apresentados no gráfico a seguir:

0

0,5

1

1,5

2

2,5

3

3,5

4

4,5

0 1 2 3 4 5 6 7 8 9 10x

y

A

BC

D E

F

G

H

I J

K

REGRESSÃO Sempre que desejamos estudar determinada

variável em função de outra, fazemos uma análise de regressão.

Podemos dizer que a análise de regressão tem por objetivo descrever, através de um modelo matemático, a relação entre duas variáveis, partindo de n observações das mesmas.

Page 54: Apostila de Estatística Básica

Ana Lúcia Guimarães Carvalho

ESTATÍSTICA 54

A variável sobre a qual desejamos fazer uma estimativa recebe o nome de variável dependente e a outra recebe o nome de variável independente. Assim, supondo X a variável independente e Y a dependente, vamos procurar determinar o ajustamento de uma reta à relação entre essas variáveis, ou seja, vamos obter uma função definida por: onde a e b são os parâmetros. A correlação retilínea permiti o ajustamento de uma reta, imagem da função definida por Y = aX + b Vamos, então, calcular os valores dos parâmetros a e b com a ajuda das fórmulas: e onde: n é o número de observações;

x é a média dos valores xi n

xx i∑

=( )

y é a média dos valores yi (n

yy i∑

= )

OBS: Como estamos fazendo uso de uma amostra para obtermos os valores dos parâmetros, o resultado, é uma estimativa da verdadeira equação de regressão. Sendo assim, escrevemos:

Y = aX + b

onde Y é o Y estimado. Exemplo: Nº Matem.

(xi)

Estat.

(yi)

xiyi xi2

01 5.0 6.0 30 25

08 8.0 9.0 72 64

24 7.0 8.0 56 49

38 10.0 10.0 100 100

44 6.0 5.0 30 36

58 7.0 7.0 49 49

59 9.0 8.0 72 81

72 3.0 4.0 12 9

80 8.0 6.0 48 64

92 2.0 2.0 4 4

Σxi=65 Σyi=65 Σxiyi=473 Σxi2=481

n = 10

( )2

i2i

iiii

xxn

yxyxna

∑ ∑

∑ ∑ ∑−

−=

( )265481x10

65x65473x10a

−=

86320585

505

22548104

22547304a ,

..

..==

−=

como:

5610

65ye56

10

65x ,, ====

b = 6,5 – 0,8632 x 6,5 = 6,5 – 5,6108 = 0,8892 a = 0,86 e b = 0,89 Logo:

Y = 0,86X + 0,89 Para traçarmos a reta no gráfico, basta determinar dois de seus pontos:

X = 0 Y = 0,89

X = 5 Y = 0,86 x 5 + 0,89 = 5,19 Assim temos:

Y = 0,86X + 0,89

01

2345

678

910

0 2 4 6 8 10x

y

5

0,89

5,19

Y = aX + b

( )2

i2i

iiii

xxn

yxyxna

∑ ∑

∑ ∑ ∑−

−=

xayb −=

Page 55: Apostila de Estatística Básica

Ana Lúcia Guimarães Carvalho

ESTATÍSTICA 55

Exercícios: 1) A partir da tabela:

xi 1 2 3 4 5 6 yi 70 50 40 30 20 10

a) Calcule o coeficiente de correlação b) Determine a reta ajustada c) Estime o valor Y para X = 0

2) Certa empresa, estudando a variação da

demanda de seu produto em relação à variação de preço de venda, obteve a tabela:

Preço

(xi) Demanda

(yi) Preço

(xi) Demanda

(yi) 38 350 63 246 42 325 70 238 50 297 80 223 56 270 95 215 59 256 110 208

a) Determine o coeficiente de correlação b) Estabeleça a equação da reta ajustada c) Estime Y para X=60 e X=120

3) Pretendendo-se estudar a relação entre as

variáveis”consumo de energia elétrica”(xi) e “volume de produção nas empresas industriais”(yi), fez-se uma amostragem que inclui vinte empresas, computando-se os seguintes valores:

Σxi = 11,34 , Σyi = 20,72 , Σxi

2 = 12,16 , Σyi

2 = 84,96 , Σxiyi = 22,13

a) calcule o coeficiente de correlação b) equação de regressão c) estime o consumo de energia elétrica

para um volume de produção de 3. 4) A tabela abaixo apresenta valores que

mostram como o comprimento de uma barra de aço varia conforme a temperatura:

Temperatura

(º C) 10 15 20 25 30

Comprimento (mm)

1.003 1.005 1.010 1.011 1.014

Determine:

a) o coeficiente de correlação b) a reta ajustada c) o valor estimado do comprimento da

barra para a temperatura de 18ºC d) o valor estimado do comprimento da

barra para a temperatura de 35ºC. 5) Considere os resultados de dois testes, X e

Y, obtidos por um grupo de alunos da escola A:

xi yi xi yi

11 13 28 17 14 14 30 24 19 18 31 22 19 15 34 24 22 22 37 25

Determine:

a) calcule o coeficiente de correlação; b) a equação de regressão; c) estime x para y = 4. 6) Considere os resultados de dois testes e

calcule o coeficiente de correlação , a equação de regressão e construa o gráfico.

X Y X Y 2 1 4 4 2 2 5 3 3 2 6 4 3 3 6 5 3 4 6 3 4 2