44
Professor: Carlos Alberto de Albuquerque Blog: http://professorcarlosaa.blogspot.com.br/ Email: [email protected] ESTATÍSTICA BÁSICA

Aula 4 estatistica

Embed Size (px)

Citation preview

Professor: Carlos Alberto de Albuquerque

Blog: http://professorcarlosaa.blogspot.com.br/

Email:

[email protected]

ESTATÍSTICA BÁSICA

AULA

QUATRO

RESUMOS E GRÁFICOS DE DADOS

O PROBLEMA DO CAPÍTULO

Com 26 anos de idade, Terri Schiavo era casada

e estava pretendendo ter um filho, quando sofreu

um colapso por problemas respiratórios e

cardíacos.

Tentativas para revivê-la foram inúteis e ela

entrou em coma.

Declarou-se que ela estava em um estado

vegetativo persistente, no qual ela parecia estar

acordada, mas estava inconsciente.

RESUMOS E GRÁFICOS DE DADOS

Ela permaneceu nesse estado durante 15 anos,

incapaz de se comunicar ou cuidar de si mesma.

Ela foi mantida viva através da inserção de um

tubo de alimentação.

Houve intensos debates sobre sua situação, com

alguns argumentando que se devia deixá-la

morrer sem o tubo de alimentação, enquanto

outros argumentavam que sua vida devia ser

preservada.

RESUMOS E GRÁFICOS DE DADOS

Depois de várias batalhas judiciais, o tubo de

alimentação foi removido e Terri Schiavo morreu

13 dias depois, com a idade de 41 anos.

Embora houvesse muitas opiniões diferentes e

fortes sobre o tratamento médico de Terri, havia

uma simpatia geral por ela.

Em meio aos muitos debates sobre a remoção do

tubo de alimentação, houve uma pesquisa de

opinião CNN/USA Today/Gallup, na qual fazia-se

a seguinte pergunta aos entrevistados:

RESUMOS E GRÁFICOS DE DADOS

“Com base no que você ouviu ou leu sobre o

caso, você concorda com a decisão da corte

de permitir a remoção do tudo de

alimentação?”

A sondagem foi realizada por telefone e houve

909 respostas de adultos americanos.

Perguntava-se, também, aos respondentes,

sua filiação partidária, e um gráfico de barras

foi colocado no site da CNN.

RESUMOS E GRÁFICOS DE DADOS

A figura ao lado mostra os

resultados da pesquisa,

dividida por partidos

políticos.

Com base na figura, parece

que as respostas dos

Democratas eram

substancialmente diferentes

das dos Republicanos e

independentes.

RESUMOS E GRÁFICOS DE DADOS

Não abordaremos os problemas humanos

relacionados à remoção do tubo, embora isso

suscite questões importantes que todos devem

considerar cuidadosamente.

Em vez disso, focalizaremos o gráfico .

Nossa compreensão de gráficos e da informação

que eles transmitem nos ajudará a responder esta

questão: Esse gráfico representa de maneira

justa os resultados da pesquisa?

CARACTERÍSTICAS DOS DADOS

CENTRO: Um valor representativo ou médio, que

indica onde se localiza o meio do conjunto de

dados.

VARIAÇÃO: Uma medida de quanto os valores

dos dados variam entre eles.

DISTRIBUIÇÃO: A natureza ou forma da

distribuição dos dados no conjunto de valores (tal

como em forma de sino, uniforme ou assimétrica).

CARACTERÍSTICAS DOS DADOS

OUTLIERS OU VALORES DISCREPATNTES OU

VALORES ATÍPICOS: Valores amostrais que se

localizam muito longe da maioria dos outros

valores amostrais.

TEMPO: Características dos dados que mudam

com o tempo.

DISTRIBUIÇÕES DE FREQUÊNCIAS

CONCEITO-CHAVE

Ao se trabalhar com grandes conjunto de

dados, em geral é útil organizá-los e resumi-

los em uma tabela, chamada DISTRIBUIÇÃO

DE FREQUÊNCIA, definida a seguir.

Em particular, uma distribuição de

frequência nos ajuda a entender a natureza

da DISTRIBUIÇÃO de um conjunto de dados.

DISTRIBUIÇÕES DE FREQUÊNCIAS

DEFINIÇÃO

Uma distribuição de frequência (ou tabela

de frequência) mostra como o conjunto de

dados é dividido entre todas as várias

categorias (ou classes), listando todas as

categorias juntamente com o número de

valores de dados em cada uma delas.

DISTRIBUIÇÕES DE FREQUÊNCIAS

A Tabela 2-2 é uma

distribuição de frequência que

resume as taxas de pulsação de

mulheres listadas na

Tabela 2-1.

DISTRIBUIÇÕES DE FREQUÊNCIAS

A frequência de uma classe

particular é o número dos

valores originais que caem

dentro daquela classe.

A primeira classe tem uma

frequência de 12, o que

indica que 12 das taxas de

pulsação originais estão

entre 60 e 69 batimentos por

minuto.

DISTRIBUIÇÕES DE FREQUÊNCIAS

A seguir, definimos alguns termos

padrão utilizados na discussão e

construção de distribuições de

frequência.

DISTRIBUIÇÕES DE FREQUÊNCIAS

DEFINIÇÃO

Limites Inferiores de classe

são os menores números que

podem pertencer às

diferentes classes.

A Tabela 2-2 tem limites

inferiores de classe de 60,

70, 80, 90, 100, 110 e 120.

DISTRIBUIÇÕES DE FREQUÊNCIAS

DEFINIÇÃO

Limites Superiores de classe

são os maiores números que

podem pertencer às diferentes

classes.

A Tabela 2-2 tem limites

superiores de classe de 69,

79, 89, 99, 109, 119 e 129

DISTRIBUIÇÕES DE FREQUÊNCIAS

DEFINIÇÃO

Fronteiras de classe são os números usados

para separar as classes, mas sem os saltos

criados pelos limites de classe.

A Figura 2-2 mostra as lacunas criadas pelos

limites de classe da Tabela 2-2.

DISTRIBUIÇÕES DE FREQUÊNCIAS

Vemos aí que os valores 69,5; 79,5; ... ; 119,5

estão no centro dessas lacunas.

Esses números são chamados de fronteiras de

classes.

DISTRIBUIÇÕES DE FREQUÊNCIAS

Seguindo-se o padrão estabelecido, vemos que a

menor fronteira de classe é 59,5 e a maior é

129,5.

Assim, a lista completa das fronteiras de classe é

59,5; 69,5; ... ; 119,5; 129,5.

DISTRIBUIÇÕES DE FREQUÊNCIAS

DEFINIÇÃO

Pontos Médios das classes

são os valores no meio da

classe.

A Tabela 2-2 tem pontos

médios 64,5; 74,5; ... ; 124,5.

DISTRIBUIÇÕES DE FREQUÊNCIAS

Cada ponto médio de classe

pode ser encontrado

somando-se o limite inferior

de classe ao limite superior

de classe e dividindo-se a

soma por 2.

DISTRIBUIÇÕES DE FREQUÊNCIAS

DEFINIÇÃO

Amplitude de classe é a

diferença entre dois limites

inferiores de classe

consecutivos ou duas

fronteiras inferiores de

classe consecutivas em uma

distribuição de frequência.

A Tabela 2-2 usa uma

amplitude de classe de 10.

DISTRIBUIÇÕES DE FREQUÊNCIAS

ATENÇÃO

Tome cuidado para evitar o erro comum de se

considerar a amplitude de classe como a

diferença entre os limites superior e inferior de

classe.

DISTRIBUIÇÕES DE FREQUÊNCIAS

Veja a Tabela 2-2- e note que a amplitude de classe é

10 e não 9.

Podemos simplificar o processo para encontrar as

fronteiras de classe notando que elas, basicamente,

dividem a diferença entre o final de uma classe e o

início da seguinte, conforme ilustrada na Figura 2-2-.

DISTRIBUIÇÕES DE FREQUÊNCIAS

PROCEDIMENTO PARA CONSTRUÇÃO DE

UMA DISTRIBUIÇÃO DE FREQUÊNCIA

1 – Determine o número de classe desejado.

O número de classes deve estar entre 5 e 20,

e o número que você escolher deve ser

influenciado pela conveniência de se usar

números redondos.

DISTRIBUIÇÕES DE FREQUÊNCIAS

2 – Calcule a amplitude de classe

Arredonde esse resultado para obter um número

conveniente.

Em geral, arredonde para cima.

Se necessário, mude o número de classes de

modo que se usem números convenientes.

DISTRIBUIÇÕES DE FREQUÊNCIAS

3 – Escolha ou o valor mínimo dos dados, ou

um valor conveniente que seja um pouco menor

do que esse valor mínimo para ser o primeiro

limite inferior de classe.

4 – Usando o limite inferior da primeira classe e

a amplitude de classe, prossiga e liste os outros

limites inferiores.

5 – Liste os limites inferiores de classe em uma

coluna vertical e prossiga para preencher os

limites superiores de classe.

DISTRIBUIÇÕES DE FREQUÊNCIAS

6 – Percorra o conjunto de dados colocando

uma marca na classe apropriada para cada

valor dado.

Conte as marcas para encontrar a frequência

total para cada classe.

DISTRIBUIÇÕES DE FREQUÊNCIAS

SOLUÇÃO

SOLUÇÃO

SOLUÇÃO

SOLUÇÃO

DISTRIBUIÇÕES DE FREQUÊNCIA RELATIVA

Uma variação da distribuição de frequência

básica é a distribuição de frequência relativa.

Em uma distribuição de frequência relativa, a

frequência de uma classe é substituída pela

frequência relativa (uma proporção) ou uma

frequência percentual.

Também pode ser chamada distribuição de

frequência percentual.

DISTRIBUIÇÕES DE FREQUÊNCIA RELATIVA

As frequências relativas são calculados como

segue:

As frequências percentuais são calculados

como segue:

DISTRIBUIÇÕES DE FREQUÊNCIA RELATIVA

Na Tabela 2-3, as frequências

reais da Tabela 2-2 são

substituídas pelas frequências

relativas correspondentes,

expressas como porcentuais.

1ª classe = 12/40 = 0,3 = 30%

2ª classe = 14/40 = 0,35 = 35%

A soma das frequências

relativas deve totalizar 1 (ou

100%)

DISTRIBUIÇÕES DE FREQUÊNCIA ACUMULADA

A frequência acumulada para uma classe é a

soma da frequência daquela classe mais as

frequências de todas as classes anteriores.

A distribuição de frequência acumulada

baseada na distribuição de frequência da

Tabela 2-2 é exibida na Tabela 2-4 a seguir.

DISTRIBUIÇÕES DE FREQUÊNCIA ACUMULADA

INTRODUÇÃO À DISTRIBUIÇÕES NORMAL

Em estatística, estamos interessados na

distribuição dos dados e, em particular, em

saber se os dados tem uma distribuição normal,

que será visto com mais detalhes nas próximas

aulas.

Uma distribuição de frequência é, em geral,

uma das primeiras ferramentas que usamos na

análise de dados, e ela, quase sempre, revela

algumas características importantes deles.

INTRODUÇÃO À DISTRIBUIÇÕES NORMAL

Dados que tem uma distribuição de

frequência aproximadamente normal são

identificados por uma distribuição de

frequência com as seguintes características:

1) As frequências começam baixas, crescem

até uma frequência máxima e, depois

decrescem para uma frequência baixa.

INTRODUÇÃO À DISTRIBUIÇÕES NORMAL

2) A distribuição deve ser aproximadamente

simétrica, com as frequências que precedem

a frequência máxima sendo

aproximadamente uma imagem espelhada

das que seguem a frequência máxima.

INTRODUÇÃO À DISTRIBUIÇÕES NORMAL

FIM

DA AULA

QUATRO