Aula bioestatistica

Preview:

Citation preview

UNIVERSIDADE ESTADUAL DO CEARÁ – UECE

CENTRO DE CIÊNCIAS E TECNOLOGIA – CECITEC

CURSO DE LICENCIATURA PLENA EM CIÊNCIAS BIOLÓGICAS

DISCIPLINA: BIOESTATÍSTICA III SEMESTRE

PROFº. ALEXANDRE LOPES ANDRADE

NOÇÕES BÁSICAS DE BIOESTATÍSTICA

Tauá/Ceará2012

1.CAP-DEFINIÇÃO

A Estatística pode ser definida como oconjunto de ferramentas para a coleta,organização, análise e interpretação dedados experimentais.

A Bioestatística consiste na aplicação daEstatística à Biologia.

HISTÓRICO DA ESTATÍSTICA

• ANTIGUIDADE: os povos já registravam o número dehabitantes, nascimentos, óbitos. Faziam "estatísticas".

• IDADE MÉDIA: as informações eram tabuladas comfinalidades tributárias e bélicas.

• SÉC. XVI: surgem as primeiras análises sistemáticas, asprimeiras tabelas e os números relativos.

• SÉC. XVIII: a estatística com feição científica é batizadapor Gottfried Achemmel (1719-1772). As tabelas ficammais completas, surgem as primeiras representaçõesgráficas e os cálculos de probabilidades

A estatística está presente em nosso dia-a-dia

• Nos jornais, revistas, nosnoticiários de televisão, napolítica, nos estudos epesquisas científicas, quandose calcula a porcentagem depessoas que concluíram oensino Fundamental, Médioe Superior... Crescimento Educacional – 2001 a 2010

ESTATÍSTICA DESCRITIVA E INFERÊNCIAL

• Descritiva: é utilizada para descrever aobservação de fenômenos, uma realidadesocial, econômica ou outra qualquer, atravésde tabelas e/ou gráficos;

Descritiva

Ano: Sede: Número de medalhas:

1972 Munique 2

1976 Montreal 2

1980 Moscou 4

1984 Los Angeles 8

1988 Seul 6

1992 Barcelona 3

1996 Atlanta 15

2000 Sydney 12

• A tabela abaixo mostra o número de medalhas de Ouro que o Brasil ganhou em olimpíadas, entre 1972 e 2000.

Nº de medalhas

0

5

10

15

Nº de medalhas

Nº de medalhas

Descritiva

ESTATÍSTICA DESCRITIVA E INFERÊNCIAL

• Indutiva: refere-se a um processo degeneralização, a partir de resultadosparticulares.

POPULAÇÃO E AMOSTRA

• População- É o conjunto da totalidade deindivíduos que apresentam uma característicacomum, cujo comportamento se quer analisar(finita ou infinita).

• Amostra- É um subconjunto finito dapopulação, ou seja, é uma parte da populaçãoda qual se observa algumas características.

VARIÁVEIS

Em Estatística trabalhamos com variáveis querepresentam as características dos elementosque formam o conjunto de dados.

As variáveis podem ser:

• Qualitativas

• Quantitativas

VARIÁVEIS

VARIÁVEIS

APRESENTAÇÃO DE DADOS

1. Tabelas- são representações que resumemum conjunto de informações observadasnum fenômeno.

São partes de uma tabela:

• Titulo

• Cabeçalho

• Corpo

TABELAS

Anos Produção por Toneladas

1995 20.000

1996 27.000

1997 27.500

1998 29.000

1999 29.800

2000 30.000

Produção de Café no Brasil 1995-2000TABELA 1.1

Fonte: Imaginária

2. Series Estatísticas- são tabelas queapresentam uma distribuição de um conjuntode dados em função da época, do local ou daespécie.

APRESENTAÇÃO DE DADOS

Série Cronológica

Anos Vendas

2000 30.000

2001 45.000

2002 75.000

2003 85.000

Vendas da Campanha 2000 a 2003TABELA 1.2

Fonte: Imaginária

Região Quantidade de Crianças

Norte 200.000

Nordeste 600.000

Sudeste 1.100.000

Sul 400.000

Centro Oeste 180.000

Série Geográfica

Vacinação contra PoliomieliteBrasil- 1993

TABELA 1.3

Fonte: Imaginária

Setor Industrial Quantidade (Toneladas)

Aço 400

Papel 180

Açúcar 90.000

Chocolate 40.000

Produção média de cada operário por setorBrasil- 2002

TABELA 1.4

Série Especifica

Fonte: Imaginária

Gráficos Estatísticos

1. Por Setor

Fonte: Google Analytcs

2. Linha:

Gráficos Estatísticos

Fonte: Associação brasileira de prevenção dos acidentes de Trânsito

3. Colunas:

Gráficos Estatísticos

Fonte: Projeto Nacional de Telessaúde – Núcleo São Paulo

2. CAP-DISTRIBUIÇÃO DE FREQUÊNCIA

• Distribuição de freqüência com intervalos declasse: quando o tamanho da amostra éelevado, é mais racional efetuar oagrupamento dos valores em vários intervalosde classe.

ELEMENTOS DE UMA DISTRIBUIÇÃO DE FREQUÊNCIA

• CLASSE- São os intervalos de variação davariável. São sempre iguais, em todas asclasses

Ex: 3ª classe é representada pela freqüência dedados encontrados entre 49 e 53 cm (49 |---- 53)

• LIMITES DE CLASSE- Sãoos extremos de cadaclasse. O menornúmero é o limiteinferior de classe e omaior número, o limitesuperior de classe. Ex:em 49 |------- 53 (classe3), o limite inferior é 49e o superior é 53.

ELEMENTOS DE UMA DISTRIBUIÇÃO DE FREQUÊNCIA

• AMPLITUDE DO INTERVALO DE CLASSE-

É a medida obtida pela diferença entre olimite superior e inferior da classe. Ex: natabela anterior, a amplitude da classe 3ª éigual a 53 - 49 = 4

Também pela Fórmula: h= AA/K

ELEMENTOS DE UMA DISTRIBUIÇÃO DE FREQUÊNCIA

• AMPLITUDE AMOSTRAL (AA)- É a diferençaentre o valor máximo e o valor mínimo daamostra (ROL). Em nosso exemplo, aamplitude da amostra é igual a 60 - 41 = 19.

Fórmula = −

ELEMENTOS DE UMA DISTRIBUIÇÃO DE FREQUÊNCIA

• AMPLITUDE TOTAL (At)- É a diferença entre olimite superior da última classe e o limiteinferior da primeira classe.

At= Xmax- Xmin

ELEMENTOS DE UMA DISTRIBUIÇÃO DE FREQUÊNCIA

• PONTO MÉDIO DA CLASSE- É o ponto quedivide o intervalo de classe em duas partesiguais. Também dado pela fórmula:

Xi= Linf+ Lsup /2

Ex: a classe 3ª

ELEMENTOS DE UMA DISTRIBUIÇÃO DE FREQUÊNCIA

• NÚMERO DE CLASSES- A primeirapreocupação para a construção de umadistribuição de freqüência.

Para a determinação do número de classes deuma distribuição, usamos a Regra de Sturges:

ELEMENTOS DE UMA DISTRIBUIÇÃO DE FREQUÊNCIA

PASSOS PARA UMA DISTRIBUIÇÃO DE FREQUÊNCIAS COM CLASSE:

1. Organize os dados brutos em Rol;

2. Calcular a Amplitude Amostral (AA);

3. Calcular o Nº de Classes (K);

4. Calcular o Ponto Médio Xi= Liminf+Limsup ;

2

5. Confeccionar a Tabela.

EXERCÍCIO

• Considere a distribuição de freqüência a seguir e responda (F) ou (V):

Diâmetro fi

4|.... 6

6|.... 8

8|.... 10

10|.... 12

12|.... 14

5

9

13

10

3

∑ 40

• a) Menos de 85% tem diâmetro não inferior a 6cm ( ).

• b) 75% das observações estão no intervalo de 6|.... 12 ( )

• c) A soma dos pontos médios é inferior a soma da Fi ( )

• d) 32,5% das observações estão na 4ª classe ( )

• e) 27% das observações tem diâmetro baixo de 10cm

( )

3.CAP- MEDIDAS DE POSIÇÃO E DISPERSÃO

As medidas de posição mais importantes sãoas medidas de tendência central, que SÃOassim chamadas pelo fato de os dados seagruparem em torno dos valores centrais.

• Média Aritmética;

• Moda;

• Mediana.

MEDIDAS DE POSIÇÃO

• Média Aritmética Simples ( X ):

Média Aritmética é o quociente da divisão da soma dos valores da variável pelo número deles:

X = ∑ Xi

• Média Aritmética Ponderada ( X ): A média é considerada Ponderada quando somam-se valores (Pesos) diferentes ao conjunto das observações:

X = ∑ xi fi

n

∑ fi

• Dados não agrupados:Ex: Sabendo-se que a produção de solvente do reatorA, durante uma semana, foi de 10, 14, 13, 15, 18, 16 e 12litros, temos, para produção média da semana:

x = 10 + 14 + 13 + 15 + 16 + 18 + 12 = 98 = 14

Ex2: Um professor aplicou quarto provas e atribuiu os seguintes pesos respectivamente: 1, 2, 3, 4. se um aluno tiver recebido as notas 8, 7, 9 e 9 nessa ordem, sua nota final será:

X= (8x1)+ (7x2)+ (9x3)+(9x4)= 85 = 8,5

Média Aritmética ( X )

7 7

1+2+3+4 10

• Dados agrupados: Sem intervalo de classe:

Consideremos a distribuição relativa a 34 famílias de quatrofilhos, tomando para variável o numero de filhos do sexomasculino:

Nº de

meninos

fi

0

1

2

3

4

2

6

10

12

4

∑ = 31

Tabela 01:

Média Aritmética ( X )

Média Aritmética ( X )

• Neste caso, como as freqüências são números indicadores daintensidade de cada valor da variável, elas funcionam comofatores de ponderação, o que nos leva a calcular a médiaaritmética ponderada, dada pela formula:

X = ∑ xi fi

∑ fi

Xi fi Xifi0

1

2

3

4

2

6

10

12

4

0

6

20

36

16

∑ = 34 ∑ = 78

Tabela 02:

X= 78/34= 2,29 ou 2,3 Meninos

• Dados agrupados: Com intervalo de classe:

Neste caso, convencionamos que todos os valores incluídosem um determinado intervalo de classe coincidem com o seuponto médio, e determinamos a média aritmética ponderada.

i Estaturas

(cm)

fi xi xifi

1

2

3

4

5

6

150 – 154

154 – 158

158 – 162

162 – 166

166 – 170

170 – 174

4

9

11

8

5

3

152

156

160

164

168

172

608

1404

1760

1312

840

516

∑ = 40 ∑ = 6440

Tabela 03:

• Temos: ∑ xifi = 6440, ∑ fi = 40

x = 6440 = 161 cm40

• Moda (Mo): Denominamos moda o valor que ocorre com maior freqüência em uma série de valores.

Dados não agrupados:A serie de dados:

7, 8, 9, 10, 10, 10, 11, 12, 13, 15

Tem moda igual a 10.

Podemos, entretanto, encontrar séries nas quais não exista valor modal:

3, 5, 8, 10, 12, 13 (amodal)

Na serie: 2, 3, 4, 4, 4, 5, 6, 7, 7, 7, 8, 9

Temos duas modas: 4 e 7 (bimodal).

MEDIDAS DE POSIÇÃO

Moda (Mo):

• Dados agrupados: Sem intervalo de classe:

Uma vez agrupados os dados, épossível determinar imediatamentea moda, basta fixar da variável demaior freqüência.

Na distribuição da tabela 02, áfreqüência máxima (12)corresponde o valor 3 da variável.Logo: Mo = 3

Xi fi Xifi0

1

2

3

4

2

6

10

12

4

0

6

20

36

16

∑ = 34 ∑ =

78

Moda (Mo):

• Dados agrupados: Com intervalo de classe:

A classe que apresenta a maior freqüência é denominada classe modal.

Temos então: Mo = l* + L*/2

L* = limite superior da classe modal

l* = limite inferior da classe modal

Moda (Mo):

Na distribuição da tabela 03, á freqüência máxima (11) corresponde:

Mo = 158 + 162/2 = 160 Logo: Mo = 160 cm.

i Estaturas

(cm)

fi xi xifi

1

2

3

4

5

6

150 – 154

154 – 158

158 – 162

162 – 166

166 – 170

170 – 174

4

9

11

8

5

3

152

156

160

164

168

172

608

1404

1760

1312

840

516

∑ = 40 ∑ = 6440

Tabela 03:

• Mediana (Md): É definida como o numero que seencontra no centro de uma serie de números, estando estesdispostos segundo uma ordem.

• Dados não agrupados:

Dada uma serie de valores, como, por exemplo:

5, 13, 10, 2, 18, 15, 6, 16, 9

Ordenação (crescente ou decrescente) dos valores:

2, 5, 6, 9, 10, 13, 15, 16, 18

Em seguida, tomamos aquele valor central que apresenta omesmo numero de elementos á direita e á esquerda númerosímpar de termos.

Temos então Md = 10

MEDIDAS DE POSIÇÃO

Mediana (Md):

Se, porém, a serie dada tiver um numero par de termos, a mediana será o ponto médio.

Assim, a serie de valores:

2, 6, 7, 10 12, 13, 18, 21

Tem para mediana a média aritmética entre 10 e 12.

Logo: Md = 10 + 12/2 = 11; sendo assim a Md = 11

Mediana (Md):

• Dados agrupados: Se os dados se agrupam em uma

distribuição de freqüência, o cálculo da mediana se processade modo muito semelhante àquele dos dados não agrupados.

Apenas compara-se o valor com a Fa.Emd = ∑ fi

2

TABELA

Nº DE

MENINOSfi Fi

0

1

2

3

4

2

6

10

12

4

2

8

18

30

34

∑= 34

A mediana será aquele valor davariável que corresponde a talfreqüência acumulada:

Sendo: (∑ f1) ÷ 2 = 34 ÷ 2 = 17

Mediana (Md):

Mediana (Md):

• Dados agrupados:

Se os valores da variável estiverem agrupados em classe o

cálculo da mediana será realizado pelo seguintes passos:

• 1) Determinamos as freqüências acumuladas.

• 2) Calculamos (∑ f1) ÷ 2.

• 3) Marcamos a classe correspondente à freqüência acumulada imediatamente superior à (∑ f1) ÷ 2 − classe mediana − e, em seguida, empregamos a fórmula:

Md= l + c EMd- Fant

Onde :

l= Lim inferior da classe

c= Amplitude do intervalo de classe

Emd= Elemento da Mediana

fMd= Freqüência simples da mediana

Fant= Freqüência acumulada anterior à da classe mediana

FMd

Mediana (Md):

TABELA 6

iESTATURAS

(cm)fi Fa

123456

150 ι— 154154 ι— 158158 ι— 162162 ι— 166166 ι— 170170 ι— 174

4911853

41324323740

∑ = 40

Mediana (Md):

Quartis

Na estatística descritiva, um quartil é qualquer um dos trêsvalores que divide o conjunto ordenado de dados em quatropartes iguais, e assim cada parte representa 1/4 da amostraou população.

Assim, no caso duma amostra ordenada:

• primeiro quartil (designado por Q1/4) = quartil inferior = é ovalor aos 25% da amostra ordenada = 25º percentil

• segundo quartil (designado por Q2/4) = mediana = é o valoraté ao qual se encontra 50% da amostra ordenada = 50ºpercentil, ou 5º decil.

• terceiro quartil (designado por Q3/4) = quartil superior = valora partir do qual se encontram 25% dos valores mais elevados= valor aos 75% da amostra ordenada = 75º percentil

MEDIDAS DE DISPERSÃO

As medidas de tendência central fornecem informações valiosasmas, em geral, não são suficientes para descrever ediscriminar diferentes conjuntos de dados.

As medidas de dispersão ou variabilidade permitem visualizar amaneira como os dados espalham-se (ou concentram-se) emtorno do valor central, são elas:

• Amplitude Total; Distância Interquartílica; Desvio Médio;Desvio Padrão ; Variância;e Coeficiente de Variação.

MEDIDAS DE DISPERSÃO

• Amplitude Total (At); é a diferença entre o maior e o

menor valor do conjunto de dados.

At= Xmax- Xmin

Ex.: dados: 3, 4, 7, 8 e 8.

At= 8 – 3 = 5

• Distância Interquartílica; é a diferença entre o

terceiro e o primeiro quartil de um conjunto de dados.

Dq= Q3- Q1

Fórmula das posições dos quartis:

Q1= Eq1= n Q3= Eq3= 3n

MEDIDAS DE DISPERSÃO

2

4 4

Distância Interquartílica;

• Os Quartis são calculados a partir da fórmula:

hfi

facn

lQ

ANT4

inf1 hfi

facn

lQ

ANT4

2

inf2

hfi

facn

lQ

ANT4

3

inf3

• Desvio Médio (Dm); é a diferença entre o valor

observado e a medida de tendência central (MédiaAritmética) do conjunto de dados.

Desvio Médio (Dm);

• Calcular o desvio médio dos conjuntos de números apresentados do ex:

A= { 10,12,13,20,25,34,45}

B= {17,18,19,20,21,22,23 }

C= {-4, -3, -2, 3, 5 }

• Calcular a média X

• Calcular o somatório de todos os Xi – X em modulo | |

• Aplicar a fórmula

• Variância (S2); é uma medida que expressa um desvio

quadrático médio do conjunto de dados, e sua unidade é oquadrado da unidade dos dados.

• Desvio Padrão (S); é raiz quadrada da variância e sua

unidade de medida é a mesma que a do conjunto de dados.

• Coeficiente de Variação; é uma medida de

variabilidade relativa, definida como a razão percentual entreo desvio padrão e a média, e assim sendo uma medidaadimensional expressa em percentual.

= ∙100 X

4-CAP PROBABILIDADE

• Probabilidades- O estudo das probabilidades se faz

necessário em situações em que se conhece os desfechospossíveis de alguma situação, porém não se conhece qualdeles irá acontecer.

A probabilidade de um evento (E) é a divisão do número deresultados favoráveis pelo número de resultados possíveis (S).

P (E)= n(E)

S

PROBABILIDADE

Alguns conceitos precisam ser apresentados para facilitar a

definição e entendimento das probabilidades.

São eles:

• Experimento Aleatório- é qualquer experimento em que épossível definir todos os resultados deste sem conhecer qualdeles será observado.

• Espaço Amostral- é o conjunto de todos os valores possíveisde um experimento aleatório. (S)

• Evento -é qualquer subconjunto de um espaço amostral. (E)

• Ex: Lançamento de um dado:

S= {1,2,3,4,5,6,}

P (E1)= de ocorrer um número ímpar

P (E1)= 3/6 = ½

P (E2)= de ocorrer o nº 3

P (E2)= 1/6

• Ex2: Em um lançamento de uma moeda, qual a probabilidade de obter “cara”?

S = {Cara, Coroa}, n (S) = 2

P(E) = 1 / 2 = 0,5

PROBABILIDADE

• Lançamento de dois dados:

P (E1)= (1, 3)

P (E2)= (1, 3) ou (3, 1)

Lançamento de duas moedas:

P (E1)= duas Caras

P (E2)= uma Cara e uma Coroa

P (E3)= duas Coroas

PROBABILIDADE

• Propriedades:

1ª_ P(0)= 0

2ª_ P(S)= 1 ou 100%

3ª_ { P (par)= 1/2

{ P (ímpar)= 1/2

Logo: P(E) + P (E)= 1

4ª_ 0 < P (E) < 1

PROBABILIDADE

1/2 + 1/2= 2/2= 1

Observação:

Probabilidade de 2 partos:

M=1/2

F= ½

(a + b)2 ou (M + F)2

Probabilidade de 3 partos:

(M+ F)3

PROBABILIDADE

S= { (M, F) (M, M) (F, M) (F, F)

• A União de eventos (ou) probabilísticos é calculado pela fórmula:

P(E1 E2)= P(E1) + P(E2) - P(E1 E2)

Ex: Numa urna contém bolas...

UNIÃO DE EVENTOS

• Condição:

E1 e E2 (E1 E2) = 0

P(E1 E2)= P(E1) + P(E2)

Ex; No lançamento de um dado....

EVENTOS MUTUAMENTE EXCLUSIVOS

PROBABILIDADE CONDICIONAL

• Quando dois eventos E1 e E2 de um espaço amostral (S)qualquer ocorrem, chamamos de probabilidade E1

condicionada a E2 e representamos por P (E1/E2).

• Para o calculo utilizamos a fórmula:

P(E1/E2)= n (E1 E2)

Ex: No lançamento de um dado...

REFERÊNCIAS BIBLIOGRÁFICAS

• Crespo, Antonio Arnot. Estatística Fácil. 17ª Edição. Saraiva,2002.

• Pereira, Paulo Henrique. Noções de Estatística. Papirus, 2004.

Recommended