Statistik ved Bachelor-uddannelsen i...

Preview:

Citation preview

Statistik ved Bachelor-uddannelsen

i folkesundhedsvidenskab

Grænseværdisætninger

1

“Alt er normalfordelt”

2

3

4

Normalfordelingen

Karakteriseret ved middelværdi og spredning

5

Standardiseret normalfordeling

Middelværdi 0 og spredning 1

6

7

Eksempel

Ud fra et stort materiale har vi fundet en

gennemsnitlig højde p̊a 67.5 inches og en

empirisk spredning p 2.5 inches

Hvis højden er normalfordelt med middelvrdi

67.5 inches og en spredning p̊a 2.5 hvad er s̊a

sandsynligheden for at en tilfældigt udvalgt

person er højere end 71 inches?

Hvor mange standardafvigelser er 71 fra 67.5?

71 − 67.5

2.5= 1.4

Tabelopslag i standardnormalfordeling (B1)

eller computer: P = 0.08%

8

Er udfald nogensinde normalfordelte?

9

Fordeling af svarene p̊a spørgsm̊alet om den

generelle tilfredshed med livet.

Kurven svarer til en normalfordeling med

samme middelværdi og spredning som i

fordelingen af tilfredsheden

10

Fordeling af den gennemsnitlige tilfredshed

med livet i 220 tilfældigt udvalgte grupper p̊a

10 personer.

Kurven svarer til en normalfordeling med

samme middelværdi og spredning som i

fordelingen af tilfredsheden

11

Gennemsnit af 10 personer:

12

Gennemsnit af 25 personer:

Gennemsnit af 50 personer:

13

14

15

De store tals lov

Antag, at X1, .., Xn er n uafhængige og identisk

Bernoullifordelte variable med sandsynlighed,

p, for et positivt udfald.

Lad endvidere hx være den relative hyppighed

af positive udfald, mens ǫ er et vilk̊arlig

positivt tal. N̊ar antallet af observationer

forøges vil sandsynligheden for at forskellen p̊a

sandsynligheden og den relative hyppighed er

mindre end ǫ nærme sig 1.

P (| p − hx |< ǫ) → 1

16

Den centrale grænseværdisætning

Antag, at X1, .., Xn er n uafhængige og identisk

fordelte variable med middelværdi, E(X), og

varians, V(X), og at X̄ er den empiriske

middelværdi (gennemsnittet).

S̊a vil den empiriske middelværdi, , altid være

approksimativt normalt fordelt med

middelværdi, E(X), og varians, V(X)/n.

Approksimationen vil blive bedre og bedre, jo

flere observationer, der indsamles.

17

“Alt er normalfordelt”

• Højde

• Intelligens

• ...

18

Central grænseværdisætning → inferens

Binomialfordelingen B(n, p):

P (X = k) =

n

k

pk(1 − p)n−k

med E{X} = np og {X} = np(1 − p)

Derfor

E{X

n} = p

V {X

n} =

p(1 − p)

n

Estimation og inferens

p̂ =X

n

p̂ ∼ N(p,p(1 − p)

n)

19

20

Recommended