Estatãstica descritiva

Preview:

DESCRIPTION

Trabalho notas de aula Prof.Dr.Nilo Sampaio

Citation preview

UERJ - 2013

Prof.Dr. Nilo Sampaio

Medidas de tendência central e dispersão

Variáveis contínuas: distribuição normal

Amostra

Variabilidade amostral

Categóricas(ou qualitativas)

Numéricas(ou quantitativas)

Dicotômicas

Politômicas

Nominais(ordem não importa)

Ordinais(tem uma ordem lógica)

Discretas(números inteiros)

Contínuas(aceitam decimais)

Sexo, raça, estado civil, religião...

NSE, IMC categ, avaliação

qualitativa...

“CONTAGENS” Nº filhos, anos

de estudo...

“MEDIDAS”Peso, altura,

pressão. Renda

familiar (R$)

Categórica(ou qualitativa)

Numérica(ou quantitativa)

Medidas de ocorrênciaFREQUÊNCIA ou PORCENTAGEM Incidência Prevalência OddsMedida de precisãoINTERVALO DE CONFIANÇA

Medidas tendência centralMODAMÉDIAMEDIANA

Medidas de dispersãoAMPLITUDEVARIÂNCIADESVIO PADRÃOERRO PADRÃO

Descrição de uma variável qualitativas ou categóricas

Dicotômicas ou binárias

Politômicas

Cálculo de proporções

Divisão de um número por outro, onde onumerador está contido (é subconjunto) nodenominador

Exemplo: Desnutrição: sim /não

Em 100 crianças, 20 estão desnutridas (20%)

Dados da coorte de nascimentos de 2004. Pelotas, RS (n=6000)

NúmeroPeso ao nascer

(g)

Número de

gravidez

1 750 1

2 1500 3

3 1520 2

4 2450 4

5 1790 1

6 3000 2

7 1930 2

..... ..... ...

5999 3510 1

6000 2900 1

Descrição de uma variável numérica

Tabela que mostra um número deobservações ou valores dentro de certosintervalos

Número de gravidezes das mães da coorte de 2004. Pelotas, RS

(n=6000)

Número de gravidez Frequência (n) %

1 2092 34,9

2 1644 27,4

3 970 16,1

4 544 9,1

5 282 4,7

6 168 2,8

7 105 1,8

8 69 1,2

9 48 0,8

10 39 0,7

11 20 0,3

12 11 0,1

13 8 0,1

Número de gravidez das mães da coorte de 2004. Pelotas, RS (n=6000)

Número de gravidezes Frequência (n) %

1 2092 34,9

2 1644 27,4

3 970 16,1

≥4 1294 21,6

Peso ao nascer das crianças da coorte de 2004. Pelotas, RS (n=4555)

Peso ao nascer (gramas) Frequência %

<1000 52 1,1

1000-1499 43 0,9

1500-1999 98 2,2

2000-2499 305 6,7

2500-2999 1112 24,4

3000-3499 1747 38,3

3500-3999 976 21,5

4000 222 4,9

... mas para variáveis contínuas queremos descrever os dados de forma ainda mais sucinta!

◦ Medidas de tendência central

◦ Medidas de posição

◦ Medidas de dispersão

MEDIDAS DE TENDÊNCIA CENTRAL

MEDIDAS DE DISPERSÃO

MEDIDAS DE POSIÇÃO

MEDIDAS DE POSIÇÃO

MÉDIAMEDIANAMODA

AMPLITUDEINTERVALO INTERQUARTILVARIÂNCIADESVIO PADRÃO

TERCILQUARTILQUINTILDECILPERCENTIL

Utilizadas para variáveis:

◦ Quantitativas ou numéricas

Discreta

Contínua

São valores calculados com o objetivo dedescrever os dados de forma ainda maisresumida do que usando uma tabela

Média

Moda

Mediana

Média

◦ xi: valor de cada indivíduo◦ ∑: somatória◦ n: total de indivíduos

x

x

n

i

i

n

1

Vantagem:Utiliza TODOS os

valores da distribuição

Desvantagem:É influenciada por valores extremos

Moda◦ Valor que mais se repete na amostra (na

distribuição)

1, 1, 1, 1, 2, 2, 2, 2, 2, 3, 3, 4, 8, 9, 9

Moda: 2

◦ Quando mais de um valor se repete o mesmo número de vezes BIMODAL

Mediana Valor que divide a distribuição ao meio

1º passo: ordenar os dados de menor a maior

2º passo: ver qual valor ocupa o “meio” da distribuição

Se... Número ímpar de dados: valor do meio

1, 1, 1, 1, 2, 2, 2, 2, 2, 3, 3, 4, 8, 9, 9

Número par de dados: média dos dois do meio1, 1, 1, 2, 2, 2, 2, 3, 3, 3, 4, 8, 9, 9

Fórmula:(n + 1)/2

Semelhantes para distribuições simétricas: Peso ao nascer

◦ Média: 3131 g

◦ Mediana: 3180 g

Distantes para distribuições assimétricas: Renda familiar

◦ Média: R$ 791

◦ Mediana: R$ 500

Qual medida de tendência central usar?◦ MÉDIA ou MEDIANA?

Distribuição simétrica

0

500

1000

1500

2000

n

1000 2000 3000 4000 5000 6000Peso ao nascer

Média: 3131 gramas; Mediana: 3180 gramas

Média

Distribuição assimétrica

0

1000

2000

3000

n

0 5000 10000 15000 20000Renda familiar (reais)

Média: R$ 791; Mediana: R$ 500

Mediana

Percentis (dividem os dados em 100 partes iguais)◦ Percentil 10, percentil 50, percentil 99...

Quartis◦ Primeiro, segundo, terceiro, quarto quartil

Quintil◦ Primeiro, segundo, terceiro, quarto, quinto quintil

. su peson,d

peso ao nascer em gramas

-------------------------------------------------------------

Percentiles Smallest

1% 1950 1100

5% 2340 1490

10% 2570 1550 Obs 962

25% 2870 1570 Sum of Wgt. 962

50% 3180 Mean 3200.639

Largest Std. Dev. 511.0475

75% 3510 4690

90% 3830 4700 Variance 261169.5

95% 4050 4700 Skewness -.1061833

99% 4450 4880 Kurtosis 3.579037

Várias maneiras de medir a dispersão

◦ Amplitude (maior - menor)

◦ Amplitude interquartil (p75 - p25)

◦ Variância

◦ Desvio padrão

Amplitude◦ Valor maior – valor menor

◦ Apenas considera os valores extremos

◦ Ex: 5 medidas de glicemia em mmol/l

80; 85; 88; 90; 500

Amplitude: 500-80=480

◦ Medidas que se distanciam muito das demais influenciam muito a amplitude

Amplitude interquartil◦ Percentil 75 – percentil 25

◦ Considera apenas a parte central dos valores de um conjunto de dados

◦ Joga fora os valores mais altos e os mais baixos

Não influenciada pelos valores discrepantes

Variância (S2)◦ Boas propriedades estatísticas

◦ Usa todas as observações

◦ É uma medida dos “desvios” (ao quadrado) de cada observação em relação à média

Pq ao quadrado?

Unidade de medida ao quadrado difícil interpretação

Desvio padrão (S)◦ É a raiz quadrada da variância

◦ Quanto mais próximos os valores individuais estiverem de sua média, < a dispersão e < o desvio-padrão

◦ Muito útil para distribuições dos dados aproximadamente normais

Ou Gaussiana

Simétrica

Forma de “sino”

É uma distribuição contínua

Descreve bem fenômenos biológicos

5 4 0 0

5 0 0 0

4 6 0 0

4 2 0 0

3 8 0 0

3 4 0 0

3 0 0 0

2 6 0 0

2 2 0 0

1 8 0 0

1 4 0 0

1 0 0 0

6 0 0

1 8

1 6

1 4

1 2

1 0

8

6

4

2

0

S t d . D e v = 5 5 7 . 3 8

M e a n = 3 1 5 2

N = 5 2 5 8 . 0 0

Percentagem

Peso ao nascer

1) UMA REVISÂO SOBRE GRÀFICOS E TABELAS E SUAS

APLICAÇÔES.

• População (universo) = conjunto de todos os possíveis valores de uma variável ou característica.

• Amostra = conjunto de observações extraída de uma população.

Em Estatística, variável é atribuição de um número acada característica da unidade experimental de umaamostra ou população.

Vários tipos de variáveis são encontradas no dia-a-dia,sendo importante a distinção entre as mesmas.

Quando uma característica ou variável é não-numérica,denomina-se variável qualitativa ou atributo.

Exemplos de variável qualitativa

a) Sexo

b) Religião

c) Cor de olhos

d) Faixa etária

Uma variável qualitativa é expressa em categorias

Quando a variável é expressa numericamente, denomina-se variável quantitativa.

Uma variável quantitativa pode ser discreta ou contínua.

Exemplos de variável quantitativa

a) Peso dos órgãos

b) Idade

c) Número de filhos

d) Altura

Uma etapa importante no trabalho científico é a

divulgação à comunidade dos resultados obtidos.

É assim que a contribuição do trabalho ao

patrimônio científico da humanidade é colocada

à disposição de todos. Essa divulgação é feita

principalmente em revistas científicas

especializadas de circulação nacional e

internacional e obedece a certos padrões na sua

apresentação.

Durante os cursos de graduação e pós-graduação (não

importa a carreira escolhida), muitos, provavelmente,

terão alguma bolsa de pesquisa, farão algum estágio e

principalmente publicarão trabalhos em revistas

científicas. Tais atividades requerem do aluno a

apresentação de seu trabalho (resultados) de forma

compatível com os padrões acadêmicos nacionais e

internacionais. Além disso, na atividade profissional de

cada um, certamente haverá a necessidade de apresentar

relatórios, projetos e estudos desenvolvidos para seus

clientes.

Conteúdo de hoje:

• Tabelas de Frequência;

• Gráficos;

•Exercícios de Fixação valendo nota.

Os dados são registrados em fichas, com várias informações.

Para obter apenas os dados é preciso fazer uma apuração.

Variável qualitativa – apuração é a simples contagem

Exemplo: número de nascidos vivos para cada sexo

Variável quantitativa – anotar cada valor observado

Exemplo: número do prontuário e peso ao nascer

Após a apuração, há necessidade dos dados serem dispostos de

uma forma ordenada, quando possível, e resumida, a fim de

auxiliar o pesquisador na sua análise e facilitar a compreensão

das conclusões apresentadas ao leitor. Os dados podem estão

serem apresentados na forma de tabelas estatísticas. Essas

devem ser auto-suficientes, isto é, devem ter significado próprio,

de modo a prescindir, quando isoladas, de consultas ao texto.

Uma tabela estatística deve conter o número, o título, o corpo e

o rodapé (fonte, notas e notas específicas).

Componentes mais importantes de uma tabela:

Título – explica o que a tabela contém

Corpo – formado pelo cabeçalho, pela coluna indicadora e pelas linhas e

colunas de dados:

Cabeçalho – especifica o conteúdo das colunas

Coluna indicadora – especifica o conteúdo das linhas

título

cabeçalho

coluna indicadora

corpo

coluna de dados

Tabela de contingência: os elementos da amostra ou

população são classificados de acordo com dois ou mais

fatores (diferentes anos de arrecadação).

mais interessante!

frequência relativa

(porcentagem)

frequência

frequência

relativa

frequência

relativa

frequência

Como definir o número de classes?

- poucas: perde-se muita informação

- muitas: pode-se ter pormenores desnecessários

O número adequado de classes é definido pelo

pesquisador.

Na escolha, é conveniente usar extremos de classes fáceis

de trabalhar.

Exemplo - Tabela de variáveis contínuas

Informações sobre peso de recém-nascidos medidos

ao longo de um ano. Como fazer uma tabela com essa

informação?

1)Definir as faixas de pesos (classes)

1,0 – 1,5 1,5 – 2,0 2,0 – 2,5 2,5 – 3,0

3,0 – 3,5 3,5 – 4,0 4,0 – 4,5 4,5 – 5,0

Intervalo de classe: 0,5 kg (escolha pessoal)

2) Contar quantos dados existem em cada classe

1,0 |– 1,5 ---> 1

1,5 |– 2,0 ---> 3

2,0 |– 2,5 ---> 16

2,5 |– 3,0 ---> 31

3,0 |– 3,5 ---> 34

3,5 |– 4,0 ---> 11

4,0 |– 4,5 ---> 4

4,5 |– 5,0 ---> 2 1,5 2,0

fechado aberto

(pertence) (não pertence)

extremos de classe:

valores limites dos intervalos

de classe

podem pertencer ou não à

classe

3) Determinar o Ponto médio de cada classe: a metade de cada

intervalo considerado. PM1= (1,5 + 2,0)/2 = 1,75.

4) Somar a freqüência total das classes e determinar a freqüência

relativa fR(i)= f(i)/ftotal

Peso (kg) f(i) fR

1,25 1 1%

1,75 2 2%

2,25 16 16%

2,75 31 31%

3,25 34 34%

3,75 11 11%

4,25 4 4%

5,25 1 1%

Total 100 100%

Tabela 01 – Peso de Recém-nascidos*

* Medido até 5 horas do nascimento

Gráfico que fornece os intervalos de classe ao longo do eixo

horizontal e as frequências (absolutas ou relativas) no eixo

vertical.

1 2 3 4 50

5

10

15

20

25

30

35

40

Peso de Recém-nascidosF

req

uên

cia

Peso (Kg)

freq

1,25 1,75 2,25 2,75 3,25 3,75 4,25 4,75 5,25

1 2 3 4 5

0

5

10

15

20

25

30

35

40

Peso de Recém-nascidos

freqF

req

uên

cia

Peso (Kg)

1,25 1,75 2,25 2,75 3,25 3,75 4,25 4,75 5,25

São normalmente utilizados pararepresentar uma série temporal, conduzindoa uma interpretação dinâmica do fenômenoestudado.

Neste tipo de gráfico considera-se apenasuma variável, devendo-se tomar cuidadocom a quantidade de categorias arepresentar, afim de não prejudicar avisualização do gráfico.

Tabelas:◦ São convenientes quando há necessidade ou

relevância em explicitar todos os valores.

◦ Quando deseja-se que os parâmetrosapresentados sejam conhecidos para fins deaplicação, reprodução etc.

◦ Quando a comparação entre diferentes colunasde uma mesma linha não correlacionam-se,diretamente, com as demais linhas da tabela.

Exemplo de tabela

Gráficos:◦ Para um grande número de dados, quando não

há relevância na apresentação dos valores, é maisconveniente agrupar os dados e, se possível,grafa-los diretamente. Caso contrário, pode-segerar uma nova tabela (enxugada).

◦ Quando deseja-se avaliar ocomportamento,tendências ou a relação entreduas colunas de uma tabela.

◦ Comparar duas ou mais colunas em relação auma determinada variável. Neste caso, aapresentação em um único gráfico permite umarápida comparação.

Cabeçalhos de tabelas devem ser curtos para evitarcolunas com largura desproporcional aos seus dados.Em tais casos, é conveniente a criação de uma legendalogo abaixo da tabela. O tamanho efetivo da tabela podeneste caso ser bastante reduzido.

Quando há muitas linhas numa tabela, e a largura entreelas é estreita, convém separar com traços para evitar adescontinuidade do leitor ao comparar diferentescolunas de uma mesma linha.

O uso de continuidade de colunas deve ser avaliadoquando principalmente há espaços suficientes para quetodas as diferentes colunas da tabela sejam repetidasem cada linha.

Tabelas envolvendo matrizes simétricas podemdispensar repetições de valores e, conseqüentemente,economizar a metade do espaço.

deve propiciar uma visualização rápida do fenômeno e paraisso, conter apenas o essencial para sua execução;

o tamanho deve ser adequado à sua publicação emtrabalhos técnico-científicos, revistas, periódicos, cartazesou livros;

deve sempre ter um título e a fonte dos dados originais e,se necessário, números e notas explicativas;

deve ser construído em uma escala que não desfigure osfatos ou as relações que se deseja destacar;

atenção ao comparar diferentes gráficos - verificar apossibilidade de manter as escalas na mesma proporção;

Alguns pontos devem ser respeitados na construção de um gráfico,

a saber:

2) (FUVEST) Sabe-se que a média aritmética de 5 números inteiros distintos, estritamente positivos, é 16. O maior valor que um desses inteiros pode assumir é:

a) 16 b) 20 c) 50 d) 70 e) 100

RESPOSTA: D

3) O time de futebol do Cruzeiro de Minas Gerai, fez 6 partidas amistosas, obtendo os seguintes resultados, 4 x 2, 4 x 3, 2 x 5, 6 x 0, 5 x 3, 2 x 0. Qual a média de gols marcados nestes amistoso?

X = 4+4+2+6+5+2/ 6 = 3,8

4) 1. Um colégio resolveu inovar a forma de calcular a média final de seu alunos.

1º bimestre teve peso 2.2º bimestre teve peso 2.3 bimestre teve peso 3.4 bimestre teve peso 3.

Vamos calcular a média anual de Ricardo que obteve as seguintes notas em historia. 1 bim = 3, 2 bim = 2,5, 3 bim = 3,5 e 4 bim = 3

Classifique as variáveis abaixo em qualitativas ou quantitativas

(discretas ou contínuas):

a) População: Estação meteorológica de uma cidade.

Variável: precipitação pluviométrica, durante o ano.

Resp.:

b) P: Alunos de uma cidade.

V: Cor dos olhos.

Resp.:

c) P: Bolsa de valores de São Paulo.

V: Número de ações negociadas.

Resp.:

d) P: Funcionários de uma empresa.

V: Salários.

Resp.:

Quantitativa contínua

Qualitativa

Quantitativa discreta

Quantitativa discreta

Exercícios:

Faça a distribuição dos dados abaixo:

a) Sendo limite inferior 30 e 10 para intervalo de classe:

54429889693948669465

74645545359456784167

60738576655350418059

88853557556591817174

77736168734752336884

b) Os resultados obtidos pelo lançamento de um dado 50 vezes foram

os seguintes:

3425164265

1563152522

6244531345

4363153361

5626346256

Respostas:

a)

Σ = 1,000Σ = 50

0,080

0,200

0,380

0,600

0,780

0,920

1,000

4

10

19

30

39

46

50

0,080

0,120

0,180

0,220

0,180

0,140

0,080

35

45

55

65

75

85

95

4

6

9

11

9

7

4

30 ? 40

40 ? 50

50 ? 60

60 ? 70

70 ? 80

80 ? 90

90 ? 100

1

2

3

4

5

6

7

FriFifrixifiNOTASi

Respostas:

b)

Σ = 1,000Σ = 50

0,120

0,280

0,460

0,600

0,800

1,000

6

14

23

30

40

50

0,120

0,160

0,180

0,140

0,200

0,200

6

8

9

7

10

10

1

2

3

4

5

6

FriFifrifixi

MÉDIA ARITMÉTICA

Dados Agrupados: Sem intervalo de classes

Fórmula:

X = Σ fixi

Σ fi

Σ fi.xi = 78Σ = 34

0

6

20

36

16

2

6

10

12

4

0

1

2

3

4

fi.xifiIdade (xi)

X = 2,29

Fórmula:

X = Σ xifiΣ fi

MÉDIA ARITMÉTICA

Dados Agrupados: Com intervalo de classes

Σ fi.xi = 6440Σ = 40

608

1404

1760

1312

840

516

152

156

160

164

168

172

4

9

11

8

5

3

150 ? 154

154 ? 158

158 ? 162

162 ? 166

166 ? 170

170 ? 174

1

2

3

4

5

6

fi.xixifiEstaturas

(cm)

i

X = 161

1. 3) População ou universo é:

a) Um conjunto de pessoas;

b) Um conjunto de elementos quaisquer

c) Um conjunto de pessoas com uma característica comum;

d) Um conjunto de elementos com pelo menos uma característica em comum;

e) Um conjunto de indivíduo de um mesmo município, estado ou país.

2. 4) Uma parte da população retirada para analisá-la denomina-se:

a) Universo;

b) Parte;

c) Pedaço;

d) Dados Brutos;

e) Amostra.

3. 5) A parte da estatística que se preocupa somente com a descrição de determinadas

características de um grupo, sem tirar conclusões sobre um grupo maior denomina-se:

a) Estatística de População;

b) Estatística de Amostra;

c) Estatística Inferencial

d) Estatística Descritiva;

e) Estatística Grupal.

1. 4)Uma série estatística é denominada Temporal quando?

a) a) O elemento variável é o tempo;

b) b) O elemento variável é o local;

c) c) O elemento variável é a espécie;

d) d) É o resultado da combinação de séries estatísticas de tipos diferentes;

e) e) Os dados são agrupados em subintervalos do intervalo observado.

2. 5) Suponha que uma pesquisa de opinião pública deve ser realizada em um estado que

tem duas grandes cidades e uma zona rural. Os elementos na população de interesse são todos

os homens e mulheres do estado com idade acima de 21 anos. Que tipo de amostragem você

sugeriria?. Amostragem Estratificada

3. 6) Um médico está interessado em obter informação sobre o número médio de vezes em

que 15.000 especialistas prescreveram certa droga no ano anterior (N = 15.000). Deseja-se obter

uma amostra n = 1.600. Que tipo de amostragem você sugeriria e por que? Amostragem

Sistemática

7) 1. De acordo com as normas para representação tabular de dados, quando o valor

de um dado é muito pequeno, para ser expresso com o número de casa decimais utilizadas ou

com a unidade de medida utilizada, deve-se colocar na célula correspondente.

a) Zero (0);

b) Três pontos (...);

c) Um traço horizontal (-)

d) Um ponto de interrogação (?);

Um ponto de exclamação (!).

1. 8) Assinale a afirmativa verdadeira:

a) a) Um gráfico de barras ou colunas é aquele em que os retângulos que o compõem estão dispostos

horizontalmente.

b) b) Um gráfico de barras ou colunas é aquele em que os retângulos que o compõem estão dispostos

verticalmente.

c) c)Um gráfico de barras é aquele em que os retângulos que o compõem estão dispostos verticalmente e

um gráfico de colunas, horizontalmente.

d) d)Um gráfico de barras é aquele em que os retângulos que o compõem estão dispostos

horizontalmente e um gráfico de colunas, verticalmente.

e) e) Todas as alternativa anteriores são falsas.

1. 9) Um dado foi lançado 50 vezes e foram registrados os seguintes resultados

5 4 6 1 2 5 3 1 3 3

4 4 1 5 5 6 1 2 5 1

3 4 5 1 1 6 6 2 1 1

4 4 4 3 4 3 2 2 2 3

6 6 3 2 4 2 6 6 2 1

9a. .A amplitude Total (n)

6 a) 5

7 b) 6

8 c) 7

9 d) 10

10 e) 50

11

12

a. A freqüência simples absoluta do primeiro elemento:

a) a) 10%

b) b) 20%

c) c) 1

d) d) 10

e) e) 20

1. Qualquer variável com distribuiçãosimétrica (normal) pode ser relacionadacom uma distribuição normal padrão◦ Média: zero; DP: 1

◦ Posso estimar entre quais valores está x% dosmeus dados

2. Área abaixo da curva◦ A área abaixo de toda a curva normal = 1, ou

seja, a probabilidade de que uma observaçãofique em algum lugar abaixo da curva é 100%

3. A probabilidade de se estimar alocalização exata de um indivíduo emespecífico é “zero”◦ Não posso estimar a posição de um valor

específico, mas posso calcular: Proporção de indivíduos abaixo ou acima de certo valor

Proporção de indivíduos entre certos valores

Exemplo

Qual a probabilidade de uma criança terpeso ao nascer igual a 4000 gramas?◦ Não tenho como calcular esta probabilidade

exata, mas posso calcular...

Qual é a proporção de crianças com peso aonascer maior de 4000 gramas?

Média = 3230

DP = 610

Crianças com peso ao nascer > 4000

gramas

Distribuição normal padrão◦ (x - média)/desvio padrão

◦ (4000 - 3230)/610 = 1,26 = z

Olhando as tabelas de distribuição normal...

z = 0,1038, ou seja, 10,4% das crianças tempeso ao nascer maior do que 4000 gramas

O que seria uma amostra? Não é melhoravaliar toda a população ?

Quero conhecer um atributo de uma população (alvo)◦ Estado nutricional das crianças brasileiras

menores de 5 anos

Escolho um grupo para estudar◦ Crianças menores de 5 anos da cidade de Pelotas

Deste grupo tiro uma amostra

UNIVERSO ou POPULAÇÃO TOTAL

POPULAÇÃO ALVO

AMOSTRA

1. Representar a população◦ Equiprobabilidade = representatividade Todos os indivíduos da população alvo têm a mesma

chance de participar do estudo (de serem sorteados)

POPULAÇÃO ALVO POPULAÇÃO ALVO

2. Precisão◦ Amostra de tamanho adequado

◦ Garantir o mínimo de precisão

◦ Garantir a chance de demonstrar uma diferençaentre dois grupos PODER: probabilidade de encontrar uma diferença qdo ela

realmente existe

Quanto maior a amostra, maior o poder

◦ Estudos com baixo poder (amostra pequena) para testar associações são um desperdício de tempo e dinheiro

3. Variabilidade amostral◦ Cada amostra dá um resultado◦ Repetir o processo de amostragem e estudar a

distribuição dos resultados

Como será que a distribuição das amostrasse compara com a distribuição em todapopulação?◦ Se coletarmos muitas amostras independentes,

do mesmo tamanho, de uma mesma população ecalcularmos a média de cada amostra... Distribuição das médias amostrais

Tem importância pelo que nos conta sobrea população que representa

A média e o desvio padrão da amostra sãousados para estimar a média e o desviopadrão da população

s

xamostra

população

A média da distribuição das médiasamostrais é a média da população (isso eujá sei!!!)

E como é a variabilidade da média dapopulação?◦ O desvio padrão da distribuição das amostras se

denomina ERRO PADRÃO

Enquanto o desvio padrão mede avariabilidade dos indivíduos da amostra

... o erro padrão mede a variabilidade damédia das amostras◦ E indica com que precisão a média da população

pode ser estimada pela média amostral

Erro padrão

nep

Desvio padrão da população

Tamanho da amostra

Dificilmente nós conhecemos o desvio

padrão da população ( )

Então se usa o desvio padrão da amostra (s)para estimar o erro padrão

n

sep

Desvio padrão da amostra

Tamanho da amostra

Serve para calcular o Intervalo de Confiança

Intervalo de Confiança: intervalo de valoresque contém o parâmetro de interesse◦ Valores dentro dos quais existe uma certa

probabilidade de estar incluída a real média dapopulação

◦ Usado para comparar se existem diferenças entredois ou mais grupos Testes de hipóteses

◦ Isso será visto nas próximas aulas...

Massad E, Menezes R, Silveira P, Ortega N. MétodosQuantitativos em Medicina. SP: Manole, 2004

Kirkwood B and Sterne J. Essential of medical statistics.Blackwell Science, 2003