101
STATISTIK DAVID BRINK GRATIS STUDIEBØGER BOOKBOON.COM

Statistik - Gratis Kompendium - manan.dkmanan.dk/wp-content/uploads/2014/03/brink_david_statistik... · Statistisk testteori 7.1 Nulhypotese og alternativ hypotese 7.2 SigniÞ kanssandsynlighed

Embed Size (px)

Citation preview

Page 1: Statistik - Gratis Kompendium - manan.dkmanan.dk/wp-content/uploads/2014/03/brink_david_statistik... · Statistisk testteori 7.1 Nulhypotese og alternativ hypotese 7.2 SigniÞ kanssandsynlighed

STATISTIK DAVID BRINK

GRATIS STUDIEBØGER

BOOKBOON.COM

Page 2: Statistik - Gratis Kompendium - manan.dkmanan.dk/wp-content/uploads/2014/03/brink_david_statistik... · Statistisk testteori 7.1 Nulhypotese og alternativ hypotese 7.2 SigniÞ kanssandsynlighed

Download gratis bøger på ventus.dk / BookBooN.com

David Brink

Lær nemt! Statistik

- Kompendium

Page 3: Statistik - Gratis Kompendium - manan.dkmanan.dk/wp-content/uploads/2014/03/brink_david_statistik... · Statistisk testteori 7.1 Nulhypotese og alternativ hypotese 7.2 SigniÞ kanssandsynlighed

Download gratis bøger på ventus.dk / BookBooN.com

Lær nemt! Statistik - Kompendium

© 2006 David Brink & Ventus Publishing ApS

ISBN 87-7681-012-7

Page 4: Statistik - Gratis Kompendium - manan.dkmanan.dk/wp-content/uploads/2014/03/brink_david_statistik... · Statistisk testteori 7.1 Nulhypotese og alternativ hypotese 7.2 SigniÞ kanssandsynlighed

Download gratis bøger på ventus.dk / BookBooN.com

4

Indholdsfortegnelse1. Forord

2. Sandsynlighedsregningens grundbegreber2.1 Sandsynlighedsfelt, sandsynlighedsfunktion, udfaldsrum, hændelse2.2 Betinget sandsynlighed2.3 Uafhængige hændelser2.4 Inklusions-eksklusionsformlen2.5 Binomialkoeffi cienter2.6 Multinomialkoeffi cienter

3. Stokastiske variable3.1 Stokastiske variable, defi nition3.2 Fordelingsfunktion3.3 Diskret stokastisk variabel, punktsandsynligheder3.4 Kontinuert stokastisk variabel, tæthedsfunktion3.5 Kontinuert stokastisk variabel, fordelingsfunktion3.6 Uafhængige stokastiske variable3.7 Stokastisk vektor, simultan tæthed og fordelingsfunktion

4. Middelværdi og varians4.1 Middelværdi af stokastisk variabel4.2 Varians og spredning af stokastisk variabel4.3 Eksempel (udregning af middelværdi, varians og spredning)4.4 Vurdering af middelværdi μ og spredning σ på øjemål4.5 Additions- og multiplikationsformler for middelværdi og varians4.6 Covarians og korrelationskoeffi cient

Lær Nemt! Statistik Indholdsfortegnelse

11

12121214141617

1818181919202021

22222222232324

We have ambitions. Also for you.

SimCorp is a global leader in financial software. At SimCorp, you will be part of a large network of competent

and skilled colleagues who all aspire to reach common goals with dedication and team spirit. We invest in our

employees to ensure that you can meet your ambitions on a personal as well as on a professional level. SimCorp

employs the best qualified people within economics, finance and IT, and the majority of our colleagues have a

university or business degree within these fields.

Ambitious? Look for opportunities at www.simcorp.com/careers

www.simcorp.com

Klik

rekl

amen

Page 5: Statistik - Gratis Kompendium - manan.dkmanan.dk/wp-content/uploads/2014/03/brink_david_statistik... · Statistisk testteori 7.1 Nulhypotese og alternativ hypotese 7.2 SigniÞ kanssandsynlighed

Download gratis bøger på ventus.dk / BookBooN.com

5

5. De store tals lov5.1 Chebyshev’s ulighed5.2 De store tals lov5.3 Den centrale grænseværdisætning5.4 Eksempel (punktsandsynligheder konvergerer mod φ)

6. Beskrivende statistik6.1 Median og kvartiler6.2 Gennemsnit6.3 Empirisk varians og empirisk spredning6.4 Empirisk covarians og empirisk korrelationskoeffi cient

7. Statistisk testteori7.1 Nulhypotese og alternativ hypotese7.2 Signifi kanssandsynlighed og signifi kansniveau7.3 Fejl af type I og II7.4 Eksempel

8. Binomialfordelingen Bin(n, p) 8.1 Parametre8.2 Beskrivelse8.3 Punktsandsynligheder8.4 Middelværdi og varians8.5 Signifi kanssandsynligheden for test i binomialfordelingen8.6 Normalapproksimationen til binomialfordelingen8.7 Estimatorer8.8 Konfi densintervaller

Lær Nemt! Statistik Indholdsfortegnelse

2525252526

2727272728

2929292929

303030303031313233

BRING YOUR DIFFERENCE

Work, it’s not just about the job. It’s not just about the nine-to-five, the meetings, the conference calls, the e-mails, or even the pay. It’s about much more than that.

British American Tobacco is a truly global organization.Our companies employ more than 53,000 people in a business spanning some 180 markets worldwide.

At British American Tobacco everyone is different, yet with their own unique backgrounds, interests and skills. Combining those differences help us to do amazing things and that’s what makes life interesting!

If you have a passion for Marketing or Finance and are eager to work in a dynamic and stimulating environment, supported by a coach and mentor, then our 2-year International Management Trainee Programme would be a great start to your career.

Deadline for applications is the end of February.

FOR DETAILS ON HOW TO APPLY AND TO FIND OUT MORE PLEASE VISIT www.batgraduatecareers.com

Combining our unique individual talents to do amazing things

Klik

rekl

amen

Page 6: Statistik - Gratis Kompendium - manan.dkmanan.dk/wp-content/uploads/2014/03/brink_david_statistik... · Statistisk testteori 7.1 Nulhypotese og alternativ hypotese 7.2 SigniÞ kanssandsynlighed

Download gratis bøger på ventus.dk / BookBooN.com

6

9. Poissonfordelingen Pois(λ)9.1 Parametre9.2 Beskrivelse9.3 Punktsandsynligheder9.4 Middelværdi og varians9.5 Additionsformel9.6 Signifi kanssandsynligheder for test i Poissonfordelingen9.7 Eksempel (signifi kant stigning af salg af Skodaer)9.8 Binomialapproksimationen til Poissonfordelingen9.9 Normalapproksimationen til Poissonfordelingen9.10 Eksempel (signifi kant fald i antal klager)9.11 Estimatorer9.12 Konfi densintervaller

10. Den geometriske fordeling Geo(p)10.1 Parametre10.2 Beskrivelse10.3 Punktsandsynligheder og halesandsynligheder10.4 Middelværdi og varians

11. Den hypergeometriske fordeling HG(n, r, N)11.1 Parametre11.2 Beskrivelse11.3 Punktsandsynligheder og halesandsynligheder11.4 Middelværdi og varians11.5 Binomialapproksimationen til den hypergeometriske fordeling11.6 Normalapproksimationen til den hypergeometriske fordeling

Lær Nemt! Statistik Indholdsfortegnelse

34343434353535353636363738

3939393939

40404041414141

Zepto’s netbook. Nu også i fræk hvid højglans!

Zepto Znote V10b.Perfekt til studiet inkl. Windows XP, 12 måneders gratis Office pakke samt gratis taske

Kun 2.595,-Inkl. moms. Begrænset antal

eller find den på zepto.dk

Klik

rekl

amen

Page 7: Statistik - Gratis Kompendium - manan.dkmanan.dk/wp-content/uploads/2014/03/brink_david_statistik... · Statistisk testteori 7.1 Nulhypotese og alternativ hypotese 7.2 SigniÞ kanssandsynlighed

Download gratis bøger på ventus.dk / BookBooN.com

7

12. Multinomialfordelingen Mult(n, p1,..., pr)12.1 Parametre12.2 Beskrivelse12.3 Punktsandsynligheder12.4 Estimatorer

13. Den negative binomialfordeling NB(n, p) 13.1 Parametre13.2 Beskrivelse13.3 Punktsandsynligheder13.4 Middelværdi og varians13.5 Estimatorer

14. Eksponentialfordelingen Eks(λ)14.1 Parametre14.2 Beskrivelse14.3 Tæthed og fordelingsfunktion14.4 Middelværdi og varians

15. Normalfordelingen 15.1 Parametre15.2 Beskrivelse15.3 Tæthed og fordelingsfunktion15.4 Standardnormalfordelingen15.5 Regneregler for Φ15.6 Estimation af middelværdien μ15.7 Estimation af variansen σ2

15.8 Konfi densinterval for middelværdien μ15.9 Konfi densinterval for variansen σ2 og spredningen σ15.10 Additionsformlen

Lær Nemt! Statistik Indholdsfortegnelse

4343434343

444444444444

4545454545

4646464647484848494949

Interesserer du dig for penge- og valutapolitiske problemstillin-ger, har vi meget at byde på, fx bogen ”Pengepolitik i Danmark”. Du kan også læse vores Kvartalsoversigt eller Working Papers om makroøkonomiske emner. Hvis du kan forestille dig en dag selv at skrive artikler for Nationalbanken, kan du gå ind og se, hvad vi har at tilbyde af ledige jobs.

Se mere på www.nationalbanken.dk

Nationalbanken bidrager til: ♦ stabile priser – ved at indrette pengepolitikken efter en fast kronekurs over for euroen ♦ sikre betalinger – ved at udstede sedler og mønter og være bank for penge- og realkreditinstitutterne ♦ stabilitet i det finansielle system – ved at vurdere den finansielle stabilitet, overvåge betalingssystemer, produ-cere finansiel statistik og forvalte statens gæld. Som arbejdsplads kan vi tilbyde spændende arbejdsopgaver med et højt fagligt indhold. Vi bestræber os på at udvikle vores medarbejdere både fagligt og personligt.

Interesseret i makroøkonomi?

Danmarks Nationalbank

Klik

rekl

amen

Page 8: Statistik - Gratis Kompendium - manan.dkmanan.dk/wp-content/uploads/2014/03/brink_david_statistik... · Statistisk testteori 7.1 Nulhypotese og alternativ hypotese 7.2 SigniÞ kanssandsynlighed

Download gratis bøger på ventus.dk / BookBooN.com

8

16. Fordelinger knyttet til normalfordelingen16.1 χ2-fordelingen16.2 Student’s t-fordeling16.3 Fisher’s F-fordeling

17. Test i normalfordelingen17.1 En stikprøve, kendt varians, H0 : μ = μ017.2 En stikprøve, ukendt varians, H0 : μ = μ0 (Student’s t-test)17.3 En stikprøve, ukendt middelværdi, H0 : σ

2 = σ02

17.4 Eksempel17.5 To stikprøver, kendte varianser, H0 : μ1 = μ217.6 To stikprøver, ukendte varianser, H0 : μ1 = μ2 (Fisher-Behrens)17.7 To stikprøver, ukendte middelværdier, H0 : σ1

2 = σ22

17.8 To stikprøver, ukendt fælles varians, H0 : μ1 = μ217.9 Eksempel (sammenligning af to middelværdier)

18. Variansanalyse18.1 Formål18.2 k stikprøver, ukendt fælles varians, H0 : μ1 = . . . = μk 18.3 To eksempler (sammenligning af middelværdier i 3 stikprøver)

19. Chi-kvadrat χ2

19.1 χ2-test for fordelingslighed19.2 Normalfordelingsantagelse19.3 Standardiserede residualer19.4 Eksempel (kvinder med 5 børn)19.5 Eksempel (folketingsvalg)19.6 Eksempel (dødsfald i det preussiske kavaleri)

50505152

53535354555657575858

60606060

63636364646667

Lær Nemt! Statistik Indholdsfortegnelse

ARE YOU A FUTURE FIFTEEN?

We welcome talented, ambi�ous and global-minded young career-seekers to join our unique Future Fi�een graduate programme. Seize the F15® challenge and start your global Arla Foods career within a wide range of func�onal and geographical areas. We expect you to provide effort and determina�on. In return we give you the ideal framework for your professional and personal development. The applica�on window is open from 15 February to 15 March 2010. Keep yourself updated on www.futurefi�een.com

ARLA FOODS FUTURE FIFTEEN GRADUATE PROGRAMME

Klik

rekl

amen

Page 9: Statistik - Gratis Kompendium - manan.dkmanan.dk/wp-content/uploads/2014/03/brink_david_statistik... · Statistisk testteori 7.1 Nulhypotese og alternativ hypotese 7.2 SigniÞ kanssandsynlighed

Download gratis bøger på ventus.dk / BookBooN.com

9

20. Kontingenstabeller20.1 Defi nition, metode20.2 Standardiserede residualer20.3 Eksempel (studieretning og politisk orientering)20.4 χ2-test for 2 × 2-tabeller20.5 Fisher’s eksakte test for 2 × 2-tabeller20.6 Eksempel (Fisher’s eksakte test)

21. Fordelingsfri test21.1 Wilcoxons test for ét sæt observationer21.2 Eksempel21.3 Normalapproksimation til Wilcoxons test for ét sæt observationer21.4 Wilcoxons test for to sæt observationer21.5 Normalapproksimation til Wilcoxons test for to sæt observationer

22. Lineær regression 22.1 Modellen22.2 Estimering af parametrene β0 og β122.3 Estimatorernes fordeling22.4 Forudsagte værdier og residualer 22.5 Estimering af variansen σ2

22.6 Konfi densinterval for parametrene β0 og β122.7 Determinationskoeffi cienten R2

22.8 Forudsigelser og prediktionsinterval22.9 Oversigt over formler22.10 Eksempel

A. Engelsk-dansk ordliste

B. Oversigt over diskrete fordelinger

69697070727273

747475757677

7878787879797979808181

83

86

Lær Nemt! Statistik Indholdsfortegnelse

Vi har nogle gode tilbud, der kan hjælpe dig i dit arbejde med at finde drømmejobbet, den rigtige uddannelse eller en spændende karrierevej.

Ring eller skriv til Susanne Skov på 3266 1455 [email protected] og reservér tid til en samtale med en af vores konsulenter.

WWW.FINANSJOB.DK – DIT JOB OG KARRIERECENTER

SIDDER DU I DRØMMEJOBBET…ELLER?

Klik

rekl

amen

Page 10: Statistik - Gratis Kompendium - manan.dkmanan.dk/wp-content/uploads/2014/03/brink_david_statistik... · Statistisk testteori 7.1 Nulhypotese og alternativ hypotese 7.2 SigniÞ kanssandsynlighed

Download gratis bøger på ventus.dk / BookBooN.com

10

C. TabellerC.1 Sådan forstås tabellerneC.2 StandardnormalfordeligenC.3 χ2-fordelingen (værdier x med Fχ2(X) = 0,500 etc.)C.4 Student’s t-fordeling (værdier x med Fstudent(x) = 0,600 etc.)C.5 Fishers F-fordeling (værdier x med FFisher(x) = 0,90)C.6 Fishers F-fordeling (værdier x med FFisher(x) = 0,95)C.7 Fishers F-fordeling (værdier x med FFisher(x) = 0,99)C.8 Wilcoxons test for ét sæt observationerC.9 Wilcoxons test for 2 sæt observationer, α = 5%

D. Symbolforklaring

E. Index

87878891939495969798

99

100

Lær Nemt! Statistik Indholdsfortegnelse

MAKING MODERN LIVING POSSIBLE

READY TO GET ONBOARD?Danfoss Postgraduate Programme – Finance

DANFOSS HUMAN RESOURCES

Get onboard and send you application via pgp.danfoss.comApplication deadline: 1st of May 2010

Klik

rekl

amen

Page 11: Statistik - Gratis Kompendium - manan.dkmanan.dk/wp-content/uploads/2014/03/brink_david_statistik... · Statistisk testteori 7.1 Nulhypotese og alternativ hypotese 7.2 SigniÞ kanssandsynlighed

Download gratis bøger på ventus.dk / BookBooN.com

11

Lær Nemt! Statistik Forord

1 Forord

Det her foreliggende kompendium i statistik har som malgruppe studerende pa de økonomiske og

samfundsvidenskabelige studier. (Version 1)

Det her foreliggende kompendium i statistik har som malgruppe medicin- og psykologistude-

rende. (Version 2)

For mange studerende kommer kurset i statistik som et chok; lærebogen synes uoverskue-

lig, pensum enormt, og gymnasiematematikken ligger uendelig langt væk. ”Lær nemt statistik -

kort og præcist”er en venlig gennemgang af statistikkens centrale omrader, der lægger vægten

pa overblikket. De mange eksempler giver desuden læseren en ”kogebogsopskrift”pa, hvordan de

almindeligste opgavetyper besvares.

Det er meget sjældent træerne vokser helt ind i himlen…

www.greens.dkKLIK HER

Det sker faktisk aldrig. De senere år har afsløret store erhvervsskandaler hvor der har bl.a. har været pyntet på CV’er og generelle informationer om bestyrelsesposter i dansk erhvervsliv. Du kan ikke regne med at det du får fortalt altid er det rigtige og det er faktisk sandt at det ofte er de bedste kunder og leverandører, der pludselig går konkurs – med efterfølgende tab for dig og din virksomhed.

Du kan prøve Greens Erhvervsinformation i hele din studieperiode – helt uden beregning. Her kan du bl.a. følge Rigmor Zobels bestyrelseskarriere, Stein Baggers samarbejdspartnere, og hvem Christian Stadil tænder røgelsespinde sammen med. Kontakt os på [email protected] for at få et brugernavn og password så du allerede kan komme i gang i dag.

Via Greens Online har du altid adgang til:

• Fuldt opdaterede personbiografier på mere end 10.000 erhvervsledere

• Information om samtlige direktions- og bestyrelsesmedlemmer i Danmark

• Virksomhedsinformation på alle danske aktie- og anpartsselskaber

• Adgang til komplette årsregnskaber 5 år tilbage• Avisartikler om virksomheder og personer• Overvågning, der altid sikrer dig de nyeste information i

din mailboks

Klik

rekl

amen

Page 12: Statistik - Gratis Kompendium - manan.dkmanan.dk/wp-content/uploads/2014/03/brink_david_statistik... · Statistisk testteori 7.1 Nulhypotese og alternativ hypotese 7.2 SigniÞ kanssandsynlighed

Download gratis bøger på ventus.dk / BookBooN.com

12

Lær Nemt! Statistik Sandsynlighedsregningens grundbegreber

2 Sandsynlighedsregningens grundbegreber

2.1 Sandsynlighedsfelt, sandsynlighedsfunktion, udfaldsrum, hændelse

Et sandsynlighedsfelt er et par (Ω, P ) bestaende af en mængde Ω og en funktion P , der til hver

delmængde A af Ω knytter et reelt tal P (A) i intervallet [0, 1]. Desuden forlanges følgende 2

aksiomer opfyldt:

1. P (Ω) = 1,

2. P (⋃∞

n=1 An) =∑∞

n=1 P (An) hvis A1, A2, . . . er en følge af parvis disjunkte delmængder af

Ω.

Mængden Ω kaldes et udfaldsrum. Elementerne ω ∈ Ω kaldes udfald, og delmængderne A � Ωkaldes hændelser. Funktionen P kaldes en sandsynlighedsfunktion. For en hændelse A kaldes

P (A) sandsynligheden for A.

Af de 2 aksiomer kan udledes følgende konsekvenser:

3. P (Ø) = 0,

4. P (A\B) = P (A)− P (B) hvis B � A,

5. P (�A) = 1− P (A),

6. P (A) � P (B) hvis B � A,

7. P (A1 ∪ · · · ∪An) = P (A1) + · · ·+ P (An) hvis A1, . . . , An er parvis disjunkte hændelser,

8. P (A ∪B) = P (A) + P (B)− P (A ∩B) for vilkarlige hændelser A og B.

EKSEMPEL. Betragt mængden Ω = {1, 2, 3, 4, 5, 6}. Definer for hver delmængde A af Ω

P (A) =#A

6,

hvor #A er antallet af elementer i A. Sa er parret (Ω, P ) et sandsynlighedsfelt. Man kan se dette

sandsynlighedsfelt som model for situationen “kast med en terning”.

EKSEMPEL. Betragt nu mængden Ω = {1, 2, 3, 4, 5, 6} × {1, 2, 3, 4, 5, 6}. Definer for hver del-

mængde A af Ω

P (A) =#A

36.

Sandsynlighedsfeltet (Ω, P ) er nu model for situationen “kast med 2 terninger”. Delmængden

A = {(1, 1), (2, 2), (3, 3), (4, 4), (5, 5), (6, 6)}er hændelsen “to ens”.

2.2 Betinget sandsynlighed

For to hændelser A og B defineres den betingede sandsynlighed for A givet B som

P (A | B) :=P (A ∩B)

P (B).

Page 13: Statistik - Gratis Kompendium - manan.dkmanan.dk/wp-content/uploads/2014/03/brink_david_statistik... · Statistisk testteori 7.1 Nulhypotese og alternativ hypotese 7.2 SigniÞ kanssandsynlighed

Download gratis bøger på ventus.dk / BookBooN.com

13

Der gælder følgende sætning kaldet beregning af sandsynlighed ved opsplitning i mulige arsager:

Antag A1, . . . , An er parvis disjunkte hændelser med A1 ∪ · · · ∪ An = Ω. Da er for enhver

hændelse B:

P (B) = P (A1) · P (B | A1) + · · ·+ P (An) · P (B | An) .

EKSEMPEL. I finalen i French Open 2007 skal Nadal møde vinderen af semifinalen mellem Fede-

rer og Davidenko. En bookmaker vurderer sandsynligheden for, at Federer vinder semifinalen, til

75%. Sandsynligheden for, at Nadal kan sla Federer i finalen, vurderes til 51%, mens sandsynlig-

heden for, at Nadal kan sla Davidenko i finalen, vurderes til 80%. Bookmakeren beregner derfor

ved opsplitning i mulige arsager sandsynligheden for, at Nadal vinder French Open 2007, til

P (Nadal vinder finalen) = P (Federer vinder semifinalen)×P (Nadal vinder finalen|Federer vinder semifinalen)+P (Davidenko vinder semifinalen)×P (Nadal vinder finalen|Davidenko vinder semifinalen)

= 0,75 · 0,51 + 0,25 · 0,8= 58,25%

Lær Nemt! Statistik Sandsynlighedsregningens grundbegreber

KOM TIL KANDIDAT ÅBENTHUS D. 18. MARTS 2010

VIL DU SIKRE DIN FREMTID MED EN MÅLRETTET KANDIDAT-UDDANNELSE INDEN FOR BUSINESS? LÆS MERE OM VORES UDDANNELSER OG SAMARBEJDE MED FØRENDE DANSKE OG INTERNATIONALE VIRKSOMHEDER PÅ WWW.ASB.DK/KANDIDAT

Internationale kandidatuddannelser

med rod i virkeligheden

Praktik

Studiejobs

ASB Alumni

Summer University

Corporate partners

ASB Karrierecenter

Studiemiljø i særklasse

Job- og CompanyDating

Danske og internationale forskere

Læs mere på www.asb.dk

kandidat

Klik

rekl

amen

Page 14: Statistik - Gratis Kompendium - manan.dkmanan.dk/wp-content/uploads/2014/03/brink_david_statistik... · Statistisk testteori 7.1 Nulhypotese og alternativ hypotese 7.2 SigniÞ kanssandsynlighed

Download gratis bøger på ventus.dk / BookBooN.com

14

2.3 Uafhængige hændelser

To hændelser A og B kaldes uafhængige, hvis

P (A ∩B) = P (A) · P (B) .

Ækvivalent hermed er betingelsen P (A | B) = P (A), altsa at sandsynligheden for A er den

samme som den betingede sandsynlighed for A givet B.

Huskeregel. To hændelser er uafhængige, hvis sandsynligheden for den ene ikke pavirkes af kend-

skab til, om den anden har fundet sted.

EKSEMPEL. Der kastes en rød og en sort terning. Betragt hændelserne

A: rød terning viser 6,

B: sort terning viser 6.

Da

P (A ∩B) =136

=16· 16

= P (A) · P (B) ,

er A og B uafhængige. Sandsynligheden for, at rød terning viser 6, pavirkes ikke af kendskab til,

hvad sort terning viser.

EKSEMPEL. Der kastes en rød og en sort terning. Betragt hændelserne

A: rød terning og sort terning viser det samme,

B: rød terning og sort terning viser tilsammen 10.

Da

P (A) =16

, men P (A | B) =13

,

er A og B ikke uafhængige. Sandsynligheden for at fa to ens slag stiger, hvis man ved, at summen

af slagene er 10.

2.4 Inklusions-eksklusionsformlen

Formel 8 pa side 12 har følgende generalisering til 3 hændelser A,B, C:

P (A∪B∪C) = P (A)+P (B)+P (C)−P (A∩B)−P (A∩C)−P (B∩C)+P (A∩B∩C) .

Denne lighed kaldes inklusions-eksklusionsformlen for 3 hændelser.

EKSEMPEL. Hvad er sandsynligheden for at fa mindst en sekser i tre kast med en terning. Lad

A1 være hændelsen, at vi far en sekser i første kast, og definer A2 og A3 tilsvarende. Den søgte

sandsynlighed beregnes da ved inklusion-eksklusion:

P = P (A1 ∪A2 ∪A3)= P (A1) + P (A2) + P (A3)− P (A1 ∩A2)− P (A1 ∩A3)− P (A2 ∩A3)

+P (A1 ∩A2 ∩A3)

=16

+16

+16− 1

62− 1

62− 1

62+

163

≈ 41%

Lær Nemt! Statistik Sandsynlighedsregningens grundbegreber

Page 15: Statistik - Gratis Kompendium - manan.dkmanan.dk/wp-content/uploads/2014/03/brink_david_statistik... · Statistisk testteori 7.1 Nulhypotese og alternativ hypotese 7.2 SigniÞ kanssandsynlighed

Download gratis bøger på ventus.dk / BookBooN.com

15

Lær Nemt! Statistik Sandsynlighedsregningens grundbegreber

Der gælder følgende generalisering for n hændelser A1, A2, . . . , An med foreningsmængde A =A1 ∪ · · · ∪An:

P (A) =∑

i

P (Ai)−∑i<j

P (Ai ∩Aj) +∑

i<j<k

P (Ai ∩Aj ∩Ak)− · · · ± P (A1 ∩ · · · ∩An) .

Denne lighed kaldes inklusions-eksklusionsformlen for n hændelser.

EKSEMPEL. Der trækkes 5 tilfældige kort fra et almindeligt spil bestaende af 52 kort. Vi vil be-

stemme sandsynligheden P (B) for den hændelse B, at alle 4 kulører optræder blandt de 5 udtruk-

ne kort.

Lad til dette formal A1 være den hændelse, at ingen af de udtrukne kort er spar. Definer A2, A3

og A4 tilsvarende for henholdsvis hjerter, ruder, klør. Sa er

�B = A1 ∪A2 ∪A3 ∪A4 .

Inklusions-eksklusionsformlen giver nu

P (�B) =∑

i

P (Ai)−∑i<j

P (Ai ∩Aj) +∑

i<j<k

P (Ai ∩Aj ∩Ak)− P (A1 ∩A2 ∩A3 ∩A4) ,

altsa

P (�B) = 4 ·

(395

)(

525

) − 6 ·

(265

)(

525

) + 4 ·

(135

)(

525

) − 0 ≈ 73,6%

Dermed fas

P (B) = 1− P (�B) = 26,4%

EKSEMPEL. I en skoleklasse sidder n børn. Læreren beder alle børnene rejse sig op og sætte sig

igen pa en tilfældig plads. Lad os bestemme sandsynligheden P (B) for den hændelse B, at hvert

barn far en ny plads.

Vi starter med at nummerere børnene fra 1 til n. For hvert i defineres hændelsen

Ai : barn nummer i sætter sig pa sin gamle plads

Sa er

�B = A1 ∪ · · · ∪An .

Nu kan P (�B) beregnes ved hjælp af inklusions–eksklusionsformlen for n hændelser:

P (�B) =∑

i

P (Ai)−∑i<j

P (Ai ∩Aj) + · · · ± P (A1 ∩ · · · ∩An) ,

altsa

P (�B) =

(n

1

)1n−(

n

2

)1

n(n− 1)+ · · · ±

(n

n

)1n!

= 1− 12!

+ · · · ± 1n!

Page 16: Statistik - Gratis Kompendium - manan.dkmanan.dk/wp-content/uploads/2014/03/brink_david_statistik... · Statistisk testteori 7.1 Nulhypotese og alternativ hypotese 7.2 SigniÞ kanssandsynlighed

Download gratis bøger på ventus.dk / BookBooN.com

16

Lær Nemt! Statistik Sandsynlighedsregningens grundbegreber

Ergo er

P (B) = 1− P (�B) =12!− 1

3!+

14!− · · · ± 1

n!Det er et overraskende faktum, at denne sandsynlighed stort set ikke afhænger af n: P (B) er

meget tæt pa 37% for alle n ≥ 4.

2.5 Binomialkoefficienter

Binomialkoefficienten

(n

k

)(læses “n over k”) er defineret som

(n

k

)=

n!k!(n− k)!

=1 · 2 · 3 · · ·n

1 · 2 · · · k · 1 · 2 · · · (n− k)

for hele tal n og k med 0 � k � n. Der mindes om konventionen 0! = 1.

Arsagen til, at binomialkoefficienterne optræder igen og igen i sandsynlighedsregningen, er

følgende sætning:

Antallet af delmængder med k elementer af en mængde med n elementer er

(n

k

).

Fx er antallet af delmængder med 5 elementer (pokerhænder) af en mængde med 52 elementer (et

Klik

rekl

amen

Page 17: Statistik - Gratis Kompendium - manan.dkmanan.dk/wp-content/uploads/2014/03/brink_david_statistik... · Statistisk testteori 7.1 Nulhypotese og alternativ hypotese 7.2 SigniÞ kanssandsynlighed

Download gratis bøger på ventus.dk / BookBooN.com

17

Lær Nemt! Statistik Sandsynlighedsregningens grundbegreber

spil kort) lig (525

)= 2598960 .

En god made at huske binomialkoefficienterne pa er ved at stille dem op i Pascals trekant,hvor hvert tal er lig summen af de to ovenstaende tal:

(00

)1(

10

)(11

)1 1(

20

)(21

)(22

)1 2 1(

30

)(31

)(32

)(33

)1 3 3 1(

40

)(41

)(42

)(43

)(44

)1 4 6 4 1(

50

)(51

)(52

)(53

)(54

)(55

)1 5 10 10 5 1(

60

)(61

)(62

)(63

)(64

)(65

)(66

)1 6 15 20 15 6 1

......

Man bemærker, at der gælder regnereglen(n

n− k

)=

(n

k

), fx

(107

)=

(103

).

2.6 Multinomialkoefficienter

Multinomialkoefficienterne er defineret som(n

k1 · · · kr

)=

n!k1! · · · kr!

for hele tal n og k1, . . . , kr med n = k1 + · · ·+ kr. Multinomialkoefficienter kaldes ogsa genera-liserede binomialkoefficienter, idet binomialkoefficienten(

n

k

)er lig multinomialkoefficienten (

n

k l

)med l = n− k.

Page 18: Statistik - Gratis Kompendium - manan.dkmanan.dk/wp-content/uploads/2014/03/brink_david_statistik... · Statistisk testteori 7.1 Nulhypotese og alternativ hypotese 7.2 SigniÞ kanssandsynlighed

Download gratis bøger på ventus.dk / BookBooN.com

18

Lær Nemt! Statistik Stokastiske variable

3 Stokastiske variable

3.1 Stokastiske variable, definition

Betragt et sandsynlighedsfelt (Ω, P ). En stokastisk variabel er en afbildning X fra Ω ind i mæng-

den af reelle tal R.

Normalt kan man glemme det bagvedliggende sandsynlighedsfelt og blot tænke pa følgende hu-

skeregel:

Huskeregel: En stokastisk variabel er en funktion, der med forskellige sandsynligheder tager

forskellige værdier.

Sandsynlighederne for, at den stokastiske variabel X tager bestemte værdier, skrives pa følgende

made:

P (X = x): sandsynligheden for, at X tager værdien x ∈ R,

P (X < x): sandsynligheden for, at X tager en værdi mindre end x,

P (X > x): sandsynligheden for, at X tager en værdi større end x,

etc.

Der gælder regnereglerne

P (X ≤ x) = P (X < x) + P (X = x)P (X ≥ x) = P (X > x) + P (X = x)

1 = P (X < x) + P (X = x) + P (X > x)

3.2 Fordelingsfunktionen

Fordelingsfunktionen for en stokastisk variabel X er funktionen F : R → R givet ved

F (x) = P (X ≤ x) .

F (x) er en voksende funktion med værdier i intervallet [0, 1] og opfylder desuden F (x) → 1 for

x→∞, og F (x) → 0 for x→ −∞.

Page 19: Statistik - Gratis Kompendium - manan.dkmanan.dk/wp-content/uploads/2014/03/brink_david_statistik... · Statistisk testteori 7.1 Nulhypotese og alternativ hypotese 7.2 SigniÞ kanssandsynlighed

Download gratis bøger på ventus.dk / BookBooN.com

19

Lær Nemt! Statistik Stokastiske variable

Ved hjælp af F (x) kan alle X’s sandsynligheder regnes ud:

P (X < x) = limε→0 F (x− ε)P (X = x) = F (x)− limε→0 F (x− ε)P (X ≥ x) = 1− limε→0 F (x− ε)P (X > x) = 1− F (x)

3.3 Diskret stokastisk variabel, punktsandsynligheder

En stokastisk variabel X kaldes diskret, hvis den kun kan tage endeligt eller tællelig mange

værdier. I praksis tager diskrete stokastisk variable værdier i mængden {0, 1, 2, . . . }. Punktsand-synlighederne

P (X = k)

fastlægger X’s fordeling. Om alle A � {0, 1, 2, . . . } gælder nemlig

P (X ∈ A) =∑k∈A

P (X = k) .

Specielt haves regnereglerne

P (X ≤ k) =∑k

i=0 P (X = i)

P (X ≥ k) =∑∞

i=k P (X = i)

Punktsandsynligheder illustreres grafisk i et pindediagram:

3.4 Kontinuert stokastisk variabel, tæthedsfunktion

En stokastisk variabel X kaldes kontinuert, hvis den har en tæthedsfunktion f(x). Tætheds-

funktionen, som normalt blot kaldes tætheden, opfylder

P (X ∈ A) =∫

t∈Af(t)dt

for alle A � R. Hvis A er et interval [a, b], gælder altsa

P (a ≤ X ≤ b) =∫ b

af(t)dt .

P(X=k)

2 3 4 5 6 7

0,2

0,1

0

Page 20: Statistik - Gratis Kompendium - manan.dkmanan.dk/wp-content/uploads/2014/03/brink_david_statistik... · Statistisk testteori 7.1 Nulhypotese og alternativ hypotese 7.2 SigniÞ kanssandsynlighed

Download gratis bøger på ventus.dk / BookBooN.com

20

Lær Nemt! Statistik Stokastiske variable

3.5 Kontinuert stokastisk variabel, fordelingsfunktion

For en kontinuert stokastisk variabel X med tæthed f(x) er fordelingsfunktionen F (x) givet ved

F (x) =∫ x

−∞f(t)dt .

Fordelingsfunktionen opfylder følgende regneregler:

P (X ≤ x) = F (x)

P (X ≥ x) = 1− F (x)

P (|X| ≤ x) = F (x)− F (−x)

P (|X| ≥ x) = F (−x) + 1− F (x)

3.6 Uafhængige stokastiske variable

To stokastiske variable X og Y kaldes uafhængige, hvis der for alle A,B � R gælder, at hæn-

delserne X ∈ A og Y ∈ B er uafhængige. Pa tilsvarende vis defineres uafhængighed af tre eller

flere stokastiske variable.

Huskeregel. X og Y er uafhængige, hvis man ikke kan slutte noget om Y ’s værdi ved at kende

X’s værdi.

EKSEMPEL. Kast en rød terning og en sort terning og betragt de stokastiske variable

Carpe cursum operis eminentis

Gratis Studiemedlemsskab!www.ma-kasse.dk

(Find vejen til drømmejobbet)

A-KASSEN FORHØJTUDDANNEDEK

lik p

å re

klam

en

Page 21: Statistik - Gratis Kompendium - manan.dkmanan.dk/wp-content/uploads/2014/03/brink_david_statistik... · Statistisk testteori 7.1 Nulhypotese og alternativ hypotese 7.2 SigniÞ kanssandsynlighed

Download gratis bøger på ventus.dk / BookBooN.com

21

Lær Nemt! Statistik Stokastiske variable

X: antal øjne af rød terning,

Y : antal øjne af sort terning.

Z: antal øjne af rød og sort terning lagt sammen.

X og Y er uafhængige, da vi ikke kan slutte noget om X ved at kende Y . X og Z er derimod ikke

uafhængige, da vi kan slutte noget om X ved at kende Z (hvis fx Z har værdien 10, ma X have

en af værdierne 4, 5 og 6).

3.7 Stokastisk vektor, simultan tæthed og fordelingsfunktion

Hvis X1, . . . , Xn er stokastiske variable defineret pa samme sandsynlighedsfelt (Ω, P ), kaldes

X = (X1, . . . , Xn) en (n-dimensional) stokastisk vektor. Det er en afbildning

X : Ω → Rn .

Den simultane (n-dimensionale) fordelingsfunktion er funktionen F : Rn → [0, 1] givet ved

F(x1, . . . , xn) = P (X1 ≤ x1 ∧ · · · ∧Xn ≤ xn) .

Antag nu at Xi’erne er kontinuerte. Sa har X en simultan (n-dimensional) tæthed f : Rn →

[0,∞[, som opfylder

P (X ∈ A) =∫x∈A

f(x) dx

for alle A � Rn. Xi’ernes individuelle tætheder fi kaldes marginale tætheder, og de fas fra den

simultane ved formlen

f1(x1) =∫

Rn−1

f(x1, . . . , xn) dx2 . . . dxn

her givet for f1(x1), de øvrige fas pa helt tilsvarende vis.

Huskeregel. De marginale tætheder fas fra den simultane tæthed ved at “integrere de overflødige

variable bort”.

Page 22: Statistik - Gratis Kompendium - manan.dkmanan.dk/wp-content/uploads/2014/03/brink_david_statistik... · Statistisk testteori 7.1 Nulhypotese og alternativ hypotese 7.2 SigniÞ kanssandsynlighed

Download gratis bøger på ventus.dk / BookBooN.com

22

Lær Nemt! Statistik Middelværdi og varians

4.2 Varians og spredning af stokastisk variabel

Variansen af en stokastisk variabel X med middelværdi E(X) = μ er defineret som

var(X) = E((X − μ)2) .

Hvis X er diskret, kan variansen udregnes saledes:

var(X) =∞∑

k=0

P (X = k) · (k − μ)2 .

Hvis X er kontinuert med tæthed f(x), kan variansen udregnes saledes:

var(X) =∫ ∞

−∞f(x)(x− μ)2 dx .

Spredningen σ (’sigma’) af en stokastisk variabel er kvadratroden af variansen.

4.3 Eksempel (udregning af middelværdi, varians og spredning)

EKSEMPEL 1. Definer den diskrete stokastiske variabel X som antallet af øjne ved kast med en

terning. Punktsandsynlighederne er P (X = k) = 1/6 for k = 1, 2, 3, 4, 5, 6. Middelværdien er

derfor

E(X) =6∑

k=1

16· k =

1 + 2 + 3 + 4 + 5 + 66

= 3,5 .

4 Middelværdi og varians

4.1 Middelværdi af stokastisk variabel

Middelværdien af en diskret stokastisk variabel X er defineret som

E(X) =∞∑

k=1

P (X = k) · k .

Middelværdien for en kontinuert stokastisk variabel X med tæthed f(x) defineres som

E(X) =∫ ∞

−∞f(x) · x dx .

Ofte bruger man bogstavet μ (’my’) om middelværdien.

Page 23: Statistik - Gratis Kompendium - manan.dkmanan.dk/wp-content/uploads/2014/03/brink_david_statistik... · Statistisk testteori 7.1 Nulhypotese og alternativ hypotese 7.2 SigniÞ kanssandsynlighed

Download gratis bøger på ventus.dk / BookBooN.com

23

Lær Nemt! Statistik Middelværdi og varians

Variansen er

var(X) =6∑

k=1

16· (k − 3,5)2 =

(1− 3,5)2 + (2− 3,5)2 + · · ·+ (6− 3,5)2

6= 2,917 .

Spredningen bliver sa

σ =√

2,917 = 1,708 .

EKSEMPEL 2. Definer den kontinuerte stokastiske variabel X som et tilfældigt reelt tal i intervallet

[0, 1]. X har sa tætheden f(x) = 1 pa [0, 1]. Middelværdien er

E(X) =∫ 1

0x dx = 0,5 .

Variansen er

var(X) =∫ 1

0(x− 0,5)2 dx = 0,083 .

Spredningen er

σ =√

0,083 = 0,289 .

4.4 Vurdering af middelværdi μ og spredning σ pa øjemal

Hvis man har givet tæthedsfunktionen (eller et pindediagram over punktsandsynlighederne) for

en stokastisk variabel, kan man pa øjemal vurdere μ og σ. Middelværdien μ er cirka “massemidt-

punktet” for fordelingen, og spredning σ er sadan, at cirka 2/3 af sandsynlighedsmassen ligger i

intervallet μ± σ.

4.5 Additions- og multiplikationsformler for middelværdi og varians

Lad X og Y være stokastiske variable. Da gælder

E(X + Y ) = E(X) + E(Y )E(aX) = a · E(X)var(X) = E(X2)− E(X)2

var(aX) = a2 · var(X)var(X + a) = var(X)

(x)

μ-r μ μ+r

0,2

0,1

Page 24: Statistik - Gratis Kompendium - manan.dkmanan.dk/wp-content/uploads/2014/03/brink_david_statistik... · Statistisk testteori 7.1 Nulhypotese og alternativ hypotese 7.2 SigniÞ kanssandsynlighed

Download gratis bøger på ventus.dk / BookBooN.com

24

Lær Nemt! Statistik Middelværdi og varians

for ethvert a ∈ R. Hvis X og Y er uafhængige, gælder desuden

E(X · Y ) = E(X) · E(Y )var(X + Y ) = var(X) + var(Y )

Huskeregel. Middelværdien er additiv. For uafhængige stokastiske variable er middelværdien

multiplikativ og variansen additiv.

4.6 Covarians og korrelationskoefficient

Covariansen for to stokastiske variable X og Y er tallet

Cov(X, Y ) = E((X − EX)(Y − EY )) .

Der gælder

Cov(X, X) = var(X)Cov(X, Y ) = E(X · Y )− EX · EY

var(X + Y ) = var(X) + var(Y ) + 2 · Cov(X, Y )

Korrelationskoefficienten ρ (’rho’) for X og Y er tallet

ρ =Cov(X, Y )

σ(X) · σ(Y ),

hvor σ(X) =√

var(X) og σ(Y ) =√

var(Y ) er X’s og Y ’s spredninger. Korrelationskoefficien-

ten er et tal i intervallet [−1, 1]. Hvis X og Y er uafhængige, er bade covariansen og ρ lig 0.

Huskeregel. En positiv korrelationskoefficient betyder, at X normalt er stor, nar Y er stor, og om-

vendt. En negativ korrelationskoefficient betyder, at X normalt er lille, nar Y er stor, og omvendt.

EKSEMPEL. Der kastes en rød og en sort terning. Betragt de stokastiske variable

X: antal øjne af rød terning,

Y : antal øjne af rød og sort terning lagt sammen.

Hvis X er stor, vil Y normalt ogsa være stor, og omvendt. Vi forventer derfor en positiv korrela-

tionskoefficient. Mere præcist udregnes

E(X) = 3,5E(Y ) = 7

E(X · Y ) = 27,42σ(X) = 1,71σ(Y ) = 2,42

Covariansen er derfor

Cov(X, Y ) = E(X · Y )− E(X) · E(Y ) = 27,42− 3,5 · 7 = 2,92

Korrelationskoefficienten bliver som forventet et positivt tal:

ρ =Cov(X, Y )

σ(X) · σ(Y )=

2,921,71 · 2,42

= 0,71 .

Page 25: Statistik - Gratis Kompendium - manan.dkmanan.dk/wp-content/uploads/2014/03/brink_david_statistik... · Statistisk testteori 7.1 Nulhypotese og alternativ hypotese 7.2 SigniÞ kanssandsynlighed

Download gratis bøger på ventus.dk / BookBooN.com

25

Lær Nemt! Statistik Middelværdi og varians

5 De store tals lov

5.1 Chebyshev’s ulighed

For en stokastisk variabel X med middelværdi μ og varians σ2 gælder Chebyshev’s ulighed

P (|X − μ| ≥ a) ≤ σ2

a2

for ethvert a > 0.

5.2 De store tals lov

Betragt en følge X1, X2, X3, . . . af uafhængige stokastiske variable med samme fordeling, og lad

μ være den fælles middelværdi. Indfør betegnelsen Sn for summerne

Sn = X1 + · · ·+ Xn .

De store tals lov siger da

P

(∣∣∣∣Sn

n− μ

∣∣∣∣ > ε

)→ 0 for n →∞

for ethvert ε > 0. Sagt i ord:

Gennemsnittet af en stikprøve fra en given fordeling konvergerer mod fordelingens middelværdi,

nar stikprøvens størrelse n gar mod∞.

5.3 Den centrale grænseværdisætning

Betragt en følge X1, X2, X3, . . . af uafhængige stokastiske variable med samme fordeling. Lad

μ være den fælles middelværdi og σ2 den fælles varians. Det antages, at σ2 er positiv. Indfør

betegnelsen S′n for de normerede summer

S′n =

X1 + · · ·+ Xn − nμ

σ√

n.

Ved “normeret” forstas, at S′n’erne har middelværdi 0 og varians 1. Den centrale grænseværdi-

sætning siger da

P (S′n ≤ x) → Φ(x) for n →∞

for alle x ∈ R, hvor Φ er fordelingsfunktionen for standardnormalfordelingen (se afsnit 15.4)

Φ(x) =∫ x

−∞1√2π

e−

12

t2

dt .

Fordelingsfunktionen for de normerede summer S′n konvergerer altsa mod Φ, nar n gar mod∞.

Dette er et ganske fantastisk resultat og sandsynlighedsregningens absolutte klimaks! Det

overraskende er, at de normerede summers grænsefordeling er uafhængig af Xi’ernes fordeling.

Page 26: Statistik - Gratis Kompendium - manan.dkmanan.dk/wp-content/uploads/2014/03/brink_david_statistik... · Statistisk testteori 7.1 Nulhypotese og alternativ hypotese 7.2 SigniÞ kanssandsynlighed

Download gratis bøger på ventus.dk / BookBooN.com

26

Lær Nemt! Statistik De store tals lov

5.4 Eksempel (fordelingsfunktionen konvergerer mod Φ)

Betragt en følge af uafhængige stokastiske variable X1, X2, . . . , der alle har punktsandsynlighe-

derne

P (Xi = 0) = P (Xi = 1) =12.

Summerne Sn = X1 + · · ·+ Xn er binomialfordelte middelværdi μ = n/2 og varians σ2 = n/4.

De normerede summer bliver dermed

S′n =

X1 + · · ·+ Xn − μ/2√n/2

.

Fordelingen af S′n er givet ved fordelingsfunktionen Fn. Den centrale grænseværdisætning siger,

at Fn konvergerer mod Φ for n → ∞. Nedenstaende figur viser Fn sammen med Φ for n =1, 2, 10, 100. Det er et øjeblik af overordentlig skønhed, nar man betragter Fn’erne falde til føje

og nærme sig Φ:

Page 27: Statistik - Gratis Kompendium - manan.dkmanan.dk/wp-content/uploads/2014/03/brink_david_statistik... · Statistisk testteori 7.1 Nulhypotese og alternativ hypotese 7.2 SigniÞ kanssandsynlighed

Download gratis bøger på ventus.dk / BookBooN.com

27

Lær Nemt! Statistik Beskrivende statistik

6 Beskrivende statistik

6.1 Median og kvartiler

Antag der foreligger n observationer x1, . . . , xn. Man definerer da observationernes medianx(0,5) som den “midterste observation”. Mere præcist er

x(0,5) =

{x(n+1)/2 hvis n ulige

(xn/2 + xn/2+1)/2 hvis n lige

idet man ordner observationer efter størrelse saledes:

x1 ≤ x2 ≤ · · · ≤ xn .

Pa tilsvarende vis defineres observationernes nedre kvartil x(0,25) saledes, at 25% af obser-

vationerne ligger under x(0,25), og observationernes øvre kvartil x(0,75) saledes, at 75% af

observationerne ligger under x(0,75).Kvartilafstanden er afstanden mellem x(0,25) og x(0,75), altsa x(0,75)− x(0,25).

6.2 Gennemsnit

Antag der foreligger n observationer x1, . . . , xn. Man definerer da observationernes gennemsnitsom

x =∑n

i=1 xi

n

6.3 Empirisk varians og empirisk spredning

Antag der foreligger n observationer x1, . . . , xn. Man definerer da observationernes empiriskevarians som

s2 =∑n

i=1(xi − x)2

n− 1.

Den empiriske spredning er kvadratroden af den empiriske varians:

s =

√∑ni=1(xi − x)2

n− 1.

Jo større den empiriske spredning s er, des mere “spredt” ligger observationerne omkring gen-

nemsnittet x.

Page 28: Statistik - Gratis Kompendium - manan.dkmanan.dk/wp-content/uploads/2014/03/brink_david_statistik... · Statistisk testteori 7.1 Nulhypotese og alternativ hypotese 7.2 SigniÞ kanssandsynlighed

Download gratis bøger på ventus.dk / BookBooN.com

28

Lær Nemt! Statistik Beskrivende statistik

6.4 Empirisk covarians og empirisk korrelationskoefficient

Antag der foreligger n observationspar (x1, y1), . . . , (xn, yn). Man definerer da observationernes

empiriske covarians som

Covemp =∑n

i=1(xi − x)(yi − y)n− 1

.

En alternativ made at udregne Covemp er ved

Covemp =∑n

i=1 xiyi − nxy

n− 1.

Den empiriske korrelationskoefficient er

r =empirisk covarians

(x’ernes empiriske spredning)(y’ernes empiriske spredning)=

Covemp

sxsy.

Den empiriske korrelationskoefficient r ligger altid i intervallet [−1, 1].

Fortolkning af den empiriske korrelationskoefficient. Hvis x-observationerne er uafhængige

af y-observationerne, ligger r tæt pa 0. Hvis x-observationerne og y-observationerne afhænger

pa den made, at store x’er oftest svarer til store y’er og omvendt, ligger r tæt pa 1. Hvis x’erne

og y’erne afhænger af hinanden pa den made, at store x’er oftest svarer til sma y’er og omvendt,

ligger r tæt pa –1.

Cheminova A/S, Postboks 9, 7620 Lemvig Tlf. 9690 9690 - www.cheminova.dk - [email protected]

Vi bidrager til at forbedre livsbe-tingelserne for verdens befolk-ning ved at levere produkter, som forøger udbyttet og kvaliteten af landbrugets afgrøder, så verdens fødevarebehov kan dækkes.

Klik

rekl

amen

Page 29: Statistik - Gratis Kompendium - manan.dkmanan.dk/wp-content/uploads/2014/03/brink_david_statistik... · Statistisk testteori 7.1 Nulhypotese og alternativ hypotese 7.2 SigniÞ kanssandsynlighed

Download gratis bøger på ventus.dk / BookBooN.com

29

Lær Nemt! Statistik Statistisk testteori

7 Statistisk testteori

7.1 Nulhypotese og alternativ hypotese

Et statistisk test er en procedure, der fører til enten accept eller forkastelse af en pa forhand givet

nulhypotese H0. Nogle gange testes H0 mod en eksplicit alternativ hypotese H1.

Til grund for testet ligger en eller flere observationer. Nulhypotesen (og den eventuelle alter-

native hypotese) drejer sig om, hvilken fordeling observationerne stammer fra.

7.2 Signifikanssandsynlighed og signifikansniveau

Man udregner nu signifikanssandsynligheden P , som er sandsynligheden – givet at H0 er sand

– for at fa lige sa ekstreme eller mere ekstreme observationer, end de foreliggende. Jo mindre P

er, des mindre plausibel er H0.

Ofte vælger man pa forhand et signifikansniveau α, typisk α = 5%. Man forkaster sa H0,

hvis P er mindre end α (man siger “H0 forkastes pa signifikansniveau α”). Hvis P er større and

α, accepteres H0 (man siger “H0 accepteres eller opretholdes pa signifikansniveau α” eller “H0

kan ikke forkastes pa signifikansniveau α”).

7.3 Fejl af type I og II

Man taler om fejl af type I, hvis man forkaster en sand nulhypotese. Hvis signifikansniveauet er

α, er risikoen for en fejl af type I højst α.

Man taler om fejl af type II, hvis man accepterer en falsk nulhypotese. Testets styrke er

sandsynligheden for at forkaste H0, hvis H1 er sand. Jo større styrken er, des mindre er risikoen

for en fejl af type II.

7.4 Eksempel

Antag at vi vil undersøge, om en bestemt terning er ægte. Ved “ægte” forstas, at sandsynligheden

p for at fa en sekser er 1/6. Vi tester nulhypotesen

H0 : p =16

(terningen er ægte)

mod den alternative hypotese

H1 : p >16

(terningen er falsk)

Observationerne, der ligger til grund for testet, er følgende 10 slag med terningen:

2, 6, 3, 6, 5, 2, 6, 6, 4, 6

Lad os pa forhand lægge os fast pa signifikansniveauet α = 5%. Nu beregnes signifikanssand-

synligheden P . Ved “ekstreme” observationer skal forstas, at der er mange seksere. P er altsa

sandsynligheden for at fa mindst 5 seksere i 10 slag med en ærlig terning. Vi udregner

P =10∑

k=5

(10k

)(1/6)k(5/6)10−k = 0,015

(se afsnit 8 om binomialfordelingen). Da P = 1,5% er mindre end α = 5%, forkaster vi H0. Hvis

terningen i virkeligheden var ægte, ville sandsynligheden for at bega en fejl af type I være 1,5%.

Page 30: Statistik - Gratis Kompendium - manan.dkmanan.dk/wp-content/uploads/2014/03/brink_david_statistik... · Statistisk testteori 7.1 Nulhypotese og alternativ hypotese 7.2 SigniÞ kanssandsynlighed

Download gratis bøger på ventus.dk / BookBooN.com

30

Lær Nemt! Statistik Binominalfordeligen Bin(n, p)

8 Binomialfordelingen Bin(n, p)

8.1 Parametre

n: antalsparameter (antal forsøg)

p: sandsynlighedsparameter (successandsynlighed)

I formlerne bruger vi ogsa “fiaskosandsynligheden” q = 1− p.

8.2 Beskrivelse

Der udføres n uafhængige forsøg, der hver resulterer i enten succes eller fiasko. I hvert forsøg er

successandsynligheden den samme, nemlig p. Det totale antal succeser X er da binomialfordelt,

og man skriver X ∼ Bin(n, p). X er en diskret stokastisk variabel og kan tage værdier i mængden

{0, 1, . . . , n}.

8.3 Punktsandsynligheder

For k ∈ {0, 1, . . . , n} er punktsandsynlighederne i en Bin(n, p)-fordeling

P (X = k) =(

n

k

)· pk · qn−k .

Se afsnit 2.5 vedrørende binomialkoefficienterne

(n

k

).

EKSEMPEL. Hvis man kaster en terning 20 gange, vil det samlede antal 6’ere X være binomial-

fordelt med antalsparameter 20 og sandsynlighedsparameter 1/6. Vi kan opskrive punktsandsyn-

lighederne P (X = k) og de kumulerede sandsynligheder P (X ≥ k) i et skema (i procent)

k 0 1 2 3 4 5 6 7 8 9P (X = k) 2,6 10,4 19,8 23,8 20,2 12,9 6,5 2,6 0,8 0,2P (X ≥ k) 100 97,4 87,0 67,1 43,3 23,1 10,2 3,7 1,1 0,3

8.4 Middelværdi og varians

Middelværdi: E(X) = np.

Varians: var(X) = npq.

Page 31: Statistik - Gratis Kompendium - manan.dkmanan.dk/wp-content/uploads/2014/03/brink_david_statistik... · Statistisk testteori 7.1 Nulhypotese og alternativ hypotese 7.2 SigniÞ kanssandsynlighed

Download gratis bøger på ventus.dk / BookBooN.com

31

Lær Nemt! Statistik Binominalfordeligen Bin(n, p)

8.5 Signifikanssandsynligheden for test i binomialfordelingen

Der udføres n uafhængige forsøg med samme successandsynlighed p, og antallet k af succeser

tælles. Vi vil teste nulhypotesen H0 : p = p0 mod en alternativ hypotese H1.

H0 H1 Signifikanssandsynlighed

p = p0 p > p0 P (X ≥ k)p = p0 p < p0 P (X ≤ k)p = p0 p = p0

∑l P (X = l)

hvor der i sidste linje summeres over alle de l, for hvilke P (X = l) ≤ P (X = k).

EKSEMPEL. Et firma køber en maskine, der kan fremstille mikrochips. Producenten af maskinen

hævder, at højst 1/6 af de fremstillede chips vil være defekte. Den første dag fremstiller maskinen

20 chips, af hvilke 6 er defekte. Kan firmaet pa denne baggrund forkaste producentens pastand?

SVAR. Vi tester nulhypotesen H0 : p = 1/6 mod den alternative hypotese H1 : p > 1/6.

Signifikanssandsynligheden beregnes til P (X ≥ 6) = 10,2% (se se fx tabellen i afsnit 8.3).

Firmaet kan altsa ikke forkaste producentens pastand pa 5-procentsniveau.

8.6 Normalapproksimationen til binomialfordelingen

Hvis antalsparameteren (antallet af forsøg) n er stor, vil en binomialfordelt stokastisk variabel X

cirka være normalfordelt med middelværdi μ = np og spredning σ =√

npq. Punktsandsynlighe-

Find ud af mere om, hvordan SPSS Inc. og predictive analyticskan hjælpe dig med at sikre din fremtid på www.spss.dk

Som studerende har du fremtiden for

dig. Ville det ikke være sejt, hvis du

kunne forudsige, hvad der vil ske?

Måske kan vi hjælpe.

SPSS Inc. er en førende global leverandør af software og

løsninger inden for predictive analytics — en teknologi, der

forbedrer forretningsprocesserne ved at give organisationer

forståelse for fremtidige konsekvenser af beslutninger, der

træffes i dag og ved at opdage mønstre i data.

Hvis du skærper din ekspertise med vores software,

forudsiger vi, at det er meget sandsynligt, at du i fremtiden

vil få succes i en af de 250.000 organisationer inden for

den private, akademiske og offentlige sektor, der anvender

SPSS-teknologi.

Klik

rekl

amen

Page 32: Statistik - Gratis Kompendium - manan.dkmanan.dk/wp-content/uploads/2014/03/brink_david_statistik... · Statistisk testteori 7.1 Nulhypotese og alternativ hypotese 7.2 SigniÞ kanssandsynlighed

Download gratis bøger på ventus.dk / BookBooN.com

32

Lær Nemt! Statistik Binominalfordeligen Bin(n, p)

derne er derfor

P (X = k) ≈ ϕ

(k − np√

npq

)· 1√

npq,

hvor ϕ er tætheden for standardnormalfordelingen, og halesandsynlighederne er

P (X ≤ k) ≈ Φ

⎛⎜⎝k +12− np

√npq

⎞⎟⎠

P (X ≥ k) ≈ 1− Φ

⎛⎜⎝k − 12− np

√npq

⎞⎟⎠hvor Φ er fordelingsfunktionen for standardnormalfordelingen (Tabel C.2).

Tommelfingerregel. Man kan bruge approksimationen, hvis np og nq begge er større end 5.

EKSEMPEL (fortsættelse af eksemplet i afsnit 8.5). Efter 2 uger har maskinen fremstillet 200 chips,

af hvilke 46 er defekte. Kan firmaet nu forkaste producentens pastand, om at sandsynligheden for

defekt er højst 1/6?

SVAR. Vi tester atter nulhypotesen H0 : p = 1/6 mod den alternative hypotese H1 : p > 1/6. Da

nu np ≈ 33 og nq ≈ 167 begge er større end 5, kan vi bruge normalapproksimationen til at finde

signifikanssandsynligheden:

P (X ≥ 46) ≈ 1− Φ

⎛⎜⎝46− 12− 33,3

√27,8

⎞⎟⎠ ≈ 1− Φ(2,3) ≈ 1,1%

Firmaet kan altsa nu forkaste producentens pastand pa 5-procentsniveau.

8.7 Estimatorer

Antag k er en observation fra en stokastisk variabel X ∼ Bin(n, p) med kendt n og ukendt p.

Maksimum likelihood-estimatet (ML-estimatet) pa p er

p =k

n.

Denne estimator er middelret (dvs. estimatorens middelværdi er p) og har variansen

var(p) =pq

n.

Udtrykket for variansen har ikke den store praktiske værdi, da det afhænger af den sande (ukendte)

sandsynlighedsparameter p. Hvis man imidlertid indsætter den estimerede værdi p pa p’s plads,

far man den estimerede variansp(1− p)

n.

Page 33: Statistik - Gratis Kompendium - manan.dkmanan.dk/wp-content/uploads/2014/03/brink_david_statistik... · Statistisk testteori 7.1 Nulhypotese og alternativ hypotese 7.2 SigniÞ kanssandsynlighed

Download gratis bøger på ventus.dk / BookBooN.com

33

Lær Nemt! Statistik Binominalfordeligen Bin(n, p)

EKSEMPEL. Vi betragter atter eksemplet med maskinen, der har fremstillet 20 mikrochips, af

hvilke de 6 er defekte. Hvad er maksimum likelihood-estimatet pa sandsynlighedsparameteren?

Hvad er dennes estimerede varians?

SVAR. Maksimum likelihood-estimatet er

p =620

= 30%

variansen pa p estimeres til0,3 · (1− 0,3)

20= 0,0105 .

Spredningen estimeres dermed til√

0,0105 ≈ 0,10. Hvis vi gar ud fra, at p ligger inden for 2

spredninger fra p, vil p altsa ligge mellem 10% og 50%.

8.8 Konfidensintervaller

Antag k er en observation fra en binomialfordelt stokastisk variabel X ∼ Bin(n, p) med kendt n

og ukendt p. Konfidensintervallet med konfidensgrad 1− α omkring punktestimatet p = k/n er[p− u1−α/2

√p(1− p)

n, p + u1−α/2

√p(1− p)

n

].

Løst sagt ligger den sande værdi p i konfidensintervallet med sandsynligheden 1− α.

Tallet u1−α/2 er fastlagt ved Φ(u1−α/2) = 1− α/2, hvor Φ er fordelingsfunktionen for stan-

dardnormalfordelingen. Det fremgar fx af Tabel C.2, at for konfidensgrad 95% er

u1−α/2 = u0,975 = 1,96 .

OPGAVE. I en Gallup-undersøgelse i ar 2012 svarer 62 ud af 100 adspurgte, at de vil stemme pa

Enhedslisten ved næste valg. Bestem konfidensintervallet med konfidensgrad 95% om den sande

procentdel af Enhedslistevælgere, og omsæt procenterne til mandattal.

SVAR. Punktestimatet er p = 62/100 = 0,62. Da konfidensgraden skal være 95%, skal α = 0,05.

Tabelopslag giver u0,975 = 1,96. Man far

1,96

√0,62 · 0,38

100= 0,095 .

Konfidensintervallet bliver dermed

[0,525 , 0,715] .

Vi kan altsa sige med 95 procents sikkerhed, at mellem 52,5% og 71,5% vil stemme pa Enhedsli-

sten, hvilket vil give mellem 94 og 128 af folketingets 179 mandater.

Page 34: Statistik - Gratis Kompendium - manan.dkmanan.dk/wp-content/uploads/2014/03/brink_david_statistik... · Statistisk testteori 7.1 Nulhypotese og alternativ hypotese 7.2 SigniÞ kanssandsynlighed

Download gratis bøger på ventus.dk / BookBooN.com

34

Lær Nemt! Statistik Poissonfordelingen Pois(λ)

9 Poissonfordelingen Pois(λ)

9.1 Parametre

λ: Intensiteten

9.2 Beskrivelse

Visse begivenheder siges at forekomme spontant, dvs. de finder sted pa tilfældige tidspunkter, men

med en vis konstant intensitet λ. Intensiteten λ er det gennemsnitlige antal spontane begivenheder

pr. tidsinterval. Antallet af spontane begivenheder X i et konkret tidsinterval er da Poissonfordelt,

og man skriver X ∼ Pois(λ). X er en diskret stokastisk variabel og kan tage værdier i mængden

{0, 1, 2, 3, . . . }.

9.3 Punktsandsynligheder

For k ∈ {0, 1, 2, 3 . . . } er punktsandsynlighederne i en Pois(λ)-fordeling

P (X = k) =λk

k!exp(−λ) .

Der mindes om konventionen 0! = 1.

EKSEMPEL. I en vis butik kommer der i gennemsnit 3 kunder pr. minut. Antallet af kunder X , der

Få op til 50% rabat på din togrejse i Danmark, 25% på salgsvognenog 25% på togrejser til udlandet, plus en lang række klubfordele.

16-26 år eller på SU?

Køb kortet nu! Det er billigst på dsb.dk/wildcard

DSB Wild

Card

giver dig m

ulighed

for at b

esøge kærester

i hele landet med

op til 50% ra

bat

dddd

ra

S

Klik

rekl

amen

Page 35: Statistik - Gratis Kompendium - manan.dkmanan.dk/wp-content/uploads/2014/03/brink_david_statistik... · Statistisk testteori 7.1 Nulhypotese og alternativ hypotese 7.2 SigniÞ kanssandsynlighed

Download gratis bøger på ventus.dk / BookBooN.com

35

Lær Nemt! Statistik Poissonfordelingen Pois(λ)

kommer i løbet af et konkret minut, er da Poissonfordelt med intensitet λ = 3. Punktsandsynlig-

hederne kan opskrives i procent i et skema:

k 0 1 2 3 4 5 6 7 8 9 ≥ 10P (X = k) 5,0 14,9 22,4 22,4 16,8 10,1 5,0 2,2 0,8 0,3 0,1

9.4 Middelværdi og varians

Middelværdi: E(X) = λ.

Varians: var(X) = λ.

9.5 Additionsformel

Antag at X1, . . . , Xn er uafhængige Poissonfordelte stokastiske variable. Lad λi være intensiteten

af Xi, altsa Xi ∼ Pois(λi). Sa er summen

X = X1 + · · ·+ Xn

Poissonfordelt med intensitet

λ = λ1 + · · ·+ λn ,

altsa X ∼ Pois(λ).

9.6 Signifikanssandsynligheder for test i Poissonfordelingen

Antag at k er en observatione fra en Pois(λ)-fordeling med ukendt intensitet λ. Vi vil teste nul-

hypotesen H0 : λ = λ0 mod en alternativ hypotese H1.

H0 H1 Signifikanssandsynlighed

λ = λ0 λ > λ0 P (X ≥ k)λ = λ0 λ < λ0 P (X ≤ k)λ = λ0 λ = λ0

∑l P (X = l)

hvor der i sidste linje summeres over alle de l, for hvilke P (X = l) ≤ P (X = k).Hvis man har givet n uafhængige observationer k1, . . . , kn fra en Pois(λ)-fordeling, kan man

udnytte, at summen k = k1 + · · ·+ kn er en observation fra en Pois(n · λ)-fordeling.

9.7 Eksempel (signifikant stigning af salg af Skodaer)

OPGAVE. En forhandler af Skoda-automobiler sælger i gennemsnit 3,5 biler om maneden. Maneden

efter et reklamefremstød for Skoda sælges 7 biler. Er dette en signifikant stigning?

SVAR. Salget af biler den givne maned kan med rimelighed antages at være Poissonfordelt med

en vis intensitet λ. Vi tester nulhypotesen

H0 : λ = 3,5

Page 36: Statistik - Gratis Kompendium - manan.dkmanan.dk/wp-content/uploads/2014/03/brink_david_statistik... · Statistisk testteori 7.1 Nulhypotese og alternativ hypotese 7.2 SigniÞ kanssandsynlighed

Download gratis bøger på ventus.dk / BookBooN.com

36

Lær Nemt! Statistik Poissonfordelingen Pois(λ)

mod den alternative hypotese

H1 : λ > 3,5 .

Signifikanssandsynligheden, altsa sandsynligheden for at sælge mindst 7 biler givet H0, er

P =∞∑

k=7

(3,5)k

k!exp(−3,5) = 0,039 + 0,017 + 0,007 + 0,002 + · · · = 0,065 .

Da P er større end 5%, kan vi ikke forkaste H0. Der er altsa ikke tale om en signifikant stigning.

9.8 Binomialapproksimationen til Poissonfordelingen

Poissonfordelingen med intensitet λ er grænseværdi for binomialfordelingen med antalsparameter

n og sandsynlighedsparameter λ/n, nar n gar mod ∞. Der gælder altsa om punktsandsynlighe-

derne

P (Xn = k) → P (X = k) for n →∞for X ∼ Pois(λ) og Xn ∼ Bin(n, λ/n). I praksis vil man dog altid bruge normalapproksimatio-

nen i stedet (se næste afsnit).

9.9 Normalapproksimationen til Poissonfordelingen

Hvis intensiteten λ er stor, vil en Poissonfordelt stokastisk variabel X cirka være normalfordelt

med middelværdi μ = λ og spredning σ =√

λ. Punktsandsynlighederne er derfor

P (X = k) ≈ ϕ

(k − λ√

λ

)· 1√

λ,

hvor ϕ er tætheden for standardnormalfordelingen, og halesandsynlighederne er

P (X ≤ k) ≈ Φ

⎛⎜⎝k +12− λ

√λ

⎞⎟⎠

P (X ≥ k) ≈ 1− Φ

⎛⎜⎝k − 12− λ

√λ

⎞⎟⎠hvor Φ er fordelingsfunktionen for standardnormalfordelingen (Tabel C.2).

Tommelfingerregel. Man kan bruge normalapproksimationen til Poissonfordelingen, hvis λ er

større end 9.

9.10 Eksempel (signifikant fald i antal klager)

OPGAVE. DSB-færgen Prinsesse Benedikte modtager gennemsnitligt 180 klager om ugen. Ugen

efter lukningen af færgens cafeteria modtages kun 112 klager. Er dette et signifikant fald?

Page 37: Statistik - Gratis Kompendium - manan.dkmanan.dk/wp-content/uploads/2014/03/brink_david_statistik... · Statistisk testteori 7.1 Nulhypotese og alternativ hypotese 7.2 SigniÞ kanssandsynlighed

Download gratis bøger på ventus.dk / BookBooN.com

37

Lær Nemt! Statistik Poissonfordelingen Pois(λ)

SVAR. Antallet af klager den givne uge kan med rimelighed antages at være Poissonfordelt med

en vis intensitet λ. Vi tester nulhypotesen

H0 : λ = 180

mod den alternative hypotese

H1 : λ < 180 .

Signifikanssandsynligheden, altsa sandsynligheden for at fa højst 112 klager givet H0, kan ap-

proksimeres med normalfordelingen:

P = Φ

⎛⎜⎝112 +12− 180

√180

⎞⎟⎠ = Φ(−5,03) < 0,0001 .

Da P er meget lille, kan vi klart forkaste H0. Der er altsa sket et klart signifikant fald.

9.11 Estimatorer

Antag k1, . . . kn er uafhængige observationer fra en stokastisk variabel X ∼ Pois(λ) med ukendt

intensitet λ. Maksimum likelihood-estimatet (ML-estimatet) pa λ er

λ = (k1 + · · ·+ kn)/n .

FÅ HELE VERDEN SOM DIN ARBEJDSPLADS!

Vil du være blandt verdens førende shippingfolk? Det Blå Danmark, eller det danske mari-time erhverv, kan tilbyde dig en shippinguddannelse af høj international standard. Danske rederier og shippingvirksomheder er førende inden for de mest avanacerede segmenter af den globale søfart og flytter dagligt 10 procent af al verdens handel til søs. Hvis du har mod på en international karriere, så gå ind på www.worldcareers.dk og find ud af, hvordan DU kan få hele verden som din arbejdsplads.

Få verden som arbejdsplads: www.worldcareers.dk

Klik

rekl

amen

Page 38: Statistik - Gratis Kompendium - manan.dkmanan.dk/wp-content/uploads/2014/03/brink_david_statistik... · Statistisk testteori 7.1 Nulhypotese og alternativ hypotese 7.2 SigniÞ kanssandsynlighed

Download gratis bøger på ventus.dk / BookBooN.com

38

Lær Nemt! Statistik Poissonfordelingen Pois(λ)

Denne estimator er middelret (dvs. estimatorens middelværdi er λ) og har variansen

var(λ) =λ

n.

Mere præcist gælder

nλ ∼ Pois(nλ) .

Hvis man indsætter den estimerede værdi λ pa λ’s plads, far man den estimerede varians

var(λ) =λ

n.

9.12 Konfidensintervaller

Antag k1, . . . , kn er uafhængige observationer fra en Poissonfordelt stokastisk variabel X ∼Pois(λ) med ukendt λ. Konfidensintervallet med konfidensgrad 1 − α omkring punktestimatet

λ = (k1 + · · ·+ kn)/n er ⎡⎣ λ− u1−α/2

√λ

n, λ + u1−α/2

√λ

n

⎤⎦ .

Løst sagt ligger den sande værdi λ i konfidensintervallet med sandsynligheden 1− α.

Tallet u1−α/2 er fastlagt ved Φ(u1−α/2) = 1− α/2, hvor Φ er fordelingsfunktionen for stan-

dardnormalfordelingen. Det fremgar fx af Tabel C.2, at for konfidensgrad 95% er

u1−α/2 = u0,975 = 1,96 .

EKSEMPEL (fortsættelse af eksemplet i afsnit 9.10). Den første uge efter lukningen af færgens

cafeteria modtages altsa 112 klager. Vi betragter k = 112 som en observation fra en Pois(λ)-fordeling og vil finde konfidensintervallet med konfidensgrad 95% omkring estimatet

λ = 112 .

Tabelopslag giver u0,975 = 1,96. Konfidensintervallet bliver dermed[112− 1,96

√112 , 112 + 1,96

√112

]≈ [91 , 133]

Page 39: Statistik - Gratis Kompendium - manan.dkmanan.dk/wp-content/uploads/2014/03/brink_david_statistik... · Statistisk testteori 7.1 Nulhypotese og alternativ hypotese 7.2 SigniÞ kanssandsynlighed

Download gratis bøger på ventus.dk / BookBooN.com

39

Lær Nemt! Statistik Den geometriske fordeling Geo(p)

10 Den geometriske fordeling Geo(p)

10.1 Parametre

p: successandsynligheden (sandsynlighedsparameteren)

I formlerne bruger vi ogsa “fiaskosandsynligheden” q = 1− p.

10.2 Beskrivelse

Der udføres en række af uafhængige forsøg, der hver resulterer i enten succes eller fiasko. Succes-

sandsynligheden p er den samme i hvert forsøg. Antallet W af fiaskoer før succes er da geometrisk

fordelt, og man skriver W ∼ Geo(p). W er en diskret stokastisk variabel og kan tage værdier i

mængden {0, 1, 2, . . . }. “Ventetiden til succes” er V = W + 1.

10.3 Punktsandsynligheder og halesandsynligheder

For k ∈ {0, 1, 2 . . . } er punktsandsynlighederne i en Geo(p)-fordeling

P (X = k) = qkp .

I modsætning til de fleste andre fordelinger kan vi let beregne den geometriske fordelings ha-

lesandsynligheder

P (X ≥ k) = qk .

EKSEMPEL. Pindediagram for punktsandsynlighederne i en geometrisk fordeling med succes-

sandsynlighed p = 0,5:

10.4 Middelværdi og varians

Middelværdi: E(W ) = q/p.

Varians: var(W ) = q/p2.

Om ventetiden til succes V = W + 1 har vi den nyttige huskeregel

Huskeregel. Middelventetiden til succes er den reciprokke successandsynlighed.

EKSEMPEL. En lotto-spiller indleverer hver uge en enkelt lotto-kupon. Sandsynligheden for at fa

7 rigtige er

p =(

367

)−1

≈ 0,0000001198 .

Middelventetiden til succes bliver dermed

E(V ) = p−1 =(

367

)uger = 160532 ar .

0.5

0.4

0.3

0.2

0.1

0 1 2 3 4 5 6

P(X=k)

k

Page 40: Statistik - Gratis Kompendium - manan.dkmanan.dk/wp-content/uploads/2014/03/brink_david_statistik... · Statistisk testteori 7.1 Nulhypotese og alternativ hypotese 7.2 SigniÞ kanssandsynlighed

Download gratis bøger på ventus.dk / BookBooN.com

40

Lær Nemt! Statistik Den hypergeometriske fordeling HG(n, r, N)

11 Den hypergeometriske fordeling HG(n, r, N)

11.1 Parametre

r: antal røde kugler

s: antal sorte kugler

N : antal kugler ialt (N = r + s)

n: antal udtagne kugler (n ≤ N )

11.2 Beskrivelse

I en urne ligger r røde kugler og s sorte kugler, altsa i alt N = r + s kugler. Der udtages nu

tilfældigt og uden tilbagelægning n kugler fra urnen. Nødvendigvis er n ≤ N . Antallet af røde

kugler Y blandt de udtagne er da hypergeometrisk fordelt, og vi skriver Y ∼ HG(n, r, N). Y er

en diskret stokastisk variabel med værdier i mængden {0, 1, . . . ,min{n, r}}.

Klik

rekl

amen

Page 41: Statistik - Gratis Kompendium - manan.dkmanan.dk/wp-content/uploads/2014/03/brink_david_statistik... · Statistisk testteori 7.1 Nulhypotese og alternativ hypotese 7.2 SigniÞ kanssandsynlighed

Download gratis bøger på ventus.dk / BookBooN.com

41

Lær Nemt! Statistik Den hypergeometriske fordeling HG(n, r, N)

11.3 Punktsandsynligheder og halesandsynligheder

For k ∈ {0, 1, . . . ,min{n, r}} er punktsandsynlighederne i en HG(n, r,N)-fordeling

P (Y = k) =

(r

k

)·(

s

n− k

)(

N

n

) .

EKSEMPEL. Frederiksberg byrad har 25 medlemmer, heraf 13 konservative. Et udvalg nedsættes

bestaende af 5 tilfældigt udvalgte byradsmedlemmer. Hvor stor er sandsynligheden, for at de kon-

servative far flertal i udvalget?

SVAR. Vi har at gøre med en hypergeometrisk fordelt stokastisk variabel Y ∼ HG(5, 13, 25) og

skal bestemme P (Y ≥ 3). Lad os først udregne alle punktsandsynligheder (i procent):

k 0 1 2 3 4 5P (Y = k) 1,5 12,1 32,3 35,5 16,1 2,4

Den ønskede sandsynlighed bliver dermed

P (Y ≥ 3) = 35,5% + 16,1% + 2,4% = 54,0%

11.4 Middelværdi og varians

Middelværdi: E(Y ) = nr/N .

Varians: var(Y ) = nrs(N − n)/(N2(N − 1)).

11.5 Binomialapproksimationen til den hypergeometriske fordeling

Hvis det udtrukne antal kugler n er smat i sammenligning bade med antallet af røde kugler r og

antallet af sorte kugler s, er det irrelevant, om udtrækningen foretages med eller uden tilbagelæg-

ning. Dermed kan vi approksimere den hypergeometriske fordeling med binomialfordelingen:

P (Y = k) ≈ P (X = k)

for Y ∼ HG(n, r,N) og X ∼ Bin(n, r/N). I praksis er spiller denne approksimation dog ingen

rolle, da det er lige sa svært at udregne P (X = k) som P (Y = k).

11.6 Normalapproksimationen til den hypergeometriske fordeling

Hvis n er lille i forhold til bade r og s, kan den hypergeometriske fordeling approksimeres med

en normalfordeling med samme middelværdi og varians.

Punktsandsynlighederne bliver sa

P (Y = k) ≈ ϕ

⎛⎜⎝ k − nr/N√nrs(N − n)/(N2(N − 1))

⎞⎟⎠ · 1√nrs(N − n)/(N2(N − 1))

,

Page 42: Statistik - Gratis Kompendium - manan.dkmanan.dk/wp-content/uploads/2014/03/brink_david_statistik... · Statistisk testteori 7.1 Nulhypotese og alternativ hypotese 7.2 SigniÞ kanssandsynlighed

Download gratis bøger på ventus.dk / BookBooN.com

42

Lær Nemt! Statistik Den hypergeometriske fordeling HG(n, r, N)

hvor ϕ er tætheden for standardnormalfordelingen. Halesandsynlighederne bliver

P (Y ≤ k) ≈ Φ

⎛⎜⎝ k +12− nr/N√

nrs(N − n)/(N2(N − 1))

⎞⎟⎠ ,

P (Y ≥ k) ≈ 1− Φ

⎛⎜⎝ k − 12− nr/N√

nrs(N − n)/(N2(N − 1))

⎞⎟⎠ ,

hvor Φ er fordelingsfunktionen for standardnormalfordelingen (Tabel C.2).

Få studiejob i DONG Energy. Afprøv teorien ipraksis og forbered dig på en mulig fastansættelse.Se mere på dongenergy.com/job og læs om de profi ler, der gik direkte fra studiejob – til job.

Læs mere på dongenergy.com/job

Den korteste vej fra

STUDIE TILKARRIERE

Klik

rekl

amen

Page 43: Statistik - Gratis Kompendium - manan.dkmanan.dk/wp-content/uploads/2014/03/brink_david_statistik... · Statistisk testteori 7.1 Nulhypotese og alternativ hypotese 7.2 SigniÞ kanssandsynlighed

Download gratis bøger på ventus.dk / BookBooN.com

43

Lær Nemt! Statistik Multinomialfordelingen Mult(n, p1,..., pr)

12 Multinomialfordelingen Mult(n, p1, . . . , pr)

12.1 Parametre

n: antalsparameter (antal forsøg)

p1: den 1. sandsynlighedsparameter...

pr: den r’te sandsynlighedsparameter

Der skal gælde p1 + · · ·+ pr = 1.

12.2 Beskrivelse

Der udføres n uafhængige forsøg, der hver resulterer i et ud af r mulige udfald. I hvert forsøg

er sandsynligheden for et udfald af type i den samme, nemlig pi. Lad Si betegne det samlede

antal udfald af type i. Den stokastiske vektor S = (S1, . . . , Sr) er da multinomialfordelt, og man

skriver S ∼ Mult(n, p1, . . . , pr). S er diskret og tager værdier i mængden {(k1, . . . kr) ∈ Zr |

ki ≥ 0 , k1 + · · ·+ kr = n}.

12.3 Punktsandsynligheder

For k1 + · · ·+ kr = n er punktsandsynlighederne i en Mult(n, p1, . . . , pr)-fordeling

P (S = (k1, . . . , kr)) =

(n

k1 · · · kr

r∏i=1

pkii

EKSEMPEL. Kast en terning 6 gange og lad, for hvert i, Si være det samlede antal i’ere. Sa er

S = (S1, . . . , S6) en multinomialfordelt stokastisk vektor: S ∼ Mult(6, 1/6, . . . , 1/6). Sandsyn-

ligheden for at fa netop 1 etter, 2 toere og 3 seksere er

P (S = (1, 2, 0, 0, 0, 3)) =

(6

1 2 0 0 0 3

)· (1/6)1 · (1/6)2 · (1/6)3 ≈ 0,13%

Her er multinomialkoefficienten (se ogsa afsnit 2.6) udregnet saledes:(6

1 2 0 0 0 3

)=

6!1!2!0!0!0!3!

=72012

= 60 .

12.4 Estimatorer

Antag k1, . . . , kr er en observation fra en stokastisk variabel S ∼ Mult(n, p1, . . . , pr) med kendt

n og ukendte pi. Maksimum likelihood-estimatet (ML-estimatet) pa pi er

pi =ki

n.

Denne estimator er middelret (dvs. estimatorens middelværdi er pi) og har variansen

var(pi) =pi(1− pi)

n.

Page 44: Statistik - Gratis Kompendium - manan.dkmanan.dk/wp-content/uploads/2014/03/brink_david_statistik... · Statistisk testteori 7.1 Nulhypotese og alternativ hypotese 7.2 SigniÞ kanssandsynlighed

Download gratis bøger på ventus.dk / BookBooN.com

44

Lær Nemt! Statistik Den negative bionomialfordeling NB(n, p)

13 Den negative binomialfordeling NB(n, p)

13.1 Parametre

n: antalsparameter

p: sandsynlighedsparameter

I formlerne bruger vi ogsa q = 1− p.

13.2 Beskrivelse

Der udføres en række af uafhængige forsøg, der hver resulterer i enten succes eller fiasko. Suc-

cessandsynligheden p er den samme i hvert forsøg. Antallet X af fiaskoer før den n’te succes er

da negativt binomialfordelt, og man skriver X ∼ NB(n, p). Den stokastisk variabel X er diskret

og kan tage værdier i mængden {0, 1, 2, . . . }.Den geometriske fordeling er specialtilfældet n = 1 af den negative binomialfordeling.

13.3 Punktsandsynligheder

For k ∈ {0, 1, 2 . . . } er punktsandsynlighederne i en NB(k, p)-fordeling

P (X = k) =(

n + k − 1n− 1

)· pn · qk .

13.4 Middelværdi og varians

Middelværdi: E(X) = nq/p.

Varians: var(X) = nq/p2.

13.5 Estimatorer

Den negative binomialfordeling bruges af og til som alternativ til Poissonfordelingen i situationer,

hvor man vil beskrive en stokastisk variabel, der tager værdier i mængden {0, 1, 2, . . . }.Antag k1, . . . , km er uafhængige observationer fra en NB(n, p)-fordeling med ukendte para-

metre n og p. Vi har da følgende estimatorer:

n =k2

s2 − k, p =

k

s2

hvor k og s2 er observationernes gennemsnit og empirisk varians.

Page 45: Statistik - Gratis Kompendium - manan.dkmanan.dk/wp-content/uploads/2014/03/brink_david_statistik... · Statistisk testteori 7.1 Nulhypotese og alternativ hypotese 7.2 SigniÞ kanssandsynlighed

Download gratis bøger på ventus.dk / BookBooN.com

45

Lær Nemt! Statistik Eksponentialfordelingen Eks(λ)

14 Eksponentialfordelingen Eks(λ)

14.1 Parametre

λ: Intensiteten

14.2 Beskrivelse

I en situation, hvor begivenheder forekommer spontant med intensiteten λ, (og hvor altsa antallet

af spontane begivenheder i et tidsinterval er Pois(λ)-fordelt), er ventetiden T mellem 2 spontane

begivenheder eksponentialfordelt, og man skriver T ∼ Eks(λ). T er en kontinuert stokastisk

variabel, der kan tage værdier i [0,∞[.

14.3 Tæthed og fordelingsfunktion

Eksponentialfordelingens tæthed er

f(x) = λ · exp(−λx) .

Fordelingsfunktionen er

F (x) = 1− exp(−λx) .

14.4 Middelværdi og varians

Middelværdi: E(T ) = 1/λ.

Varians: var(T ) = 1/λ2.

Har du lyst til at arbejde i en virksomhed, som

· har en politik om altid at rekruttere ledere indefra?

· bekymrer sig om dig og din Work-life balance?

· har et dybdegående uddannelse- og udviklingsprogram kombineret med Learning By Doing?

Se jobmuligheder på http://www.pgcareers.com

Ved spørgsmål, kontakt Nicolai Hermann på email: [email protected]

Har du potentialet til at blive fremtidens leder?

p p

akt Nicolai He

Klik

rekl

amen

Page 46: Statistik - Gratis Kompendium - manan.dkmanan.dk/wp-content/uploads/2014/03/brink_david_statistik... · Statistisk testteori 7.1 Nulhypotese og alternativ hypotese 7.2 SigniÞ kanssandsynlighed

Download gratis bøger på ventus.dk / BookBooN.com

46

Lær Nemt! Statistik Normalfordelingen

15 Normalfordelingen

15.1 Parametre

μ: middelværdi

σ2: varians

Husk at spredningen σ er kvadratroden af variansen.

15.2 Beskrivelse

Normalfordelingen er en kontinuert fordeling. Hvis en stokastisk variabel X er normalfordelt, kan

X tage værdier i hele R, og man skriver X ∼ N(μ, σ2).Normalfordelingen er den vigtigste fordeling i statistikken. Utallige naturligt forekommende

fænomener kan beskrives (eller approksimeres) med en normalfordeling.

15.3 Tæthed og fordelingsfunktion

Normalfordelingens tæthed er

f(x) =1√

2πσ2exp

(−(x− μ)2

2σ2

).

Den er symmetrisk, dvs. der gælder

f(−x) = f(x) .

Normalfordelingens fordelingsfunktion

F (x) =∫ x

−∞1√

2πσ2exp

(−(t− μ)2

2σ2

)dt

er svær at beregne. I stedet for benytter man formlen

F (x) = Φ(

x− μ

σ

)

Page 47: Statistik - Gratis Kompendium - manan.dkmanan.dk/wp-content/uploads/2014/03/brink_david_statistik... · Statistisk testteori 7.1 Nulhypotese og alternativ hypotese 7.2 SigniÞ kanssandsynlighed

Download gratis bøger på ventus.dk / BookBooN.com

47

Lær Nemt! Statistik Normalfordelingen

hvor Φ er fordelingsfunktionen for standardnormalfordelingen, som kan slas op i Tabel C.2. Af

tabellen aflæses fx:

Huskeregel. I en normalfordeling ligger 68% af sandsynlighedsmassen inden for 1 spredning om-

kring middelværdien, mens 95% af sandsynlighedsmassen ligger inden for 2 spredninger omkring

middelværdien.

15.4 Standardnormalfordelingen

En normalfordeling med middelværdi μ = 0 og varians σ2 = 1 kaldes en standardnormal-fordeling. Spredningen i en standardnormalfordeling er tydeligvis σ = 1. Tætheden ϕ(t) for en

standardnormalfordeling er

ϕ(t) =1√2π

exp(−1

2t2)

.

Fordelingsfunktionen Φ for en standardnormalfordeling er

Φ(x) =∫ x

−∞1√2π

exp(−1

2t2)

dt .

Man kan sla Φ op i Tabel C.2.

“Har du hørt, at vi laver sødemidler af birketræer?”

Med et omfattende og innovativt udbud af produkter er Danisco en af verdens førende inden for fødevareingredienser, enzymer og biobaserede løsninger. Vi bruger naturens egne materialer, videnskaben og vores 9.500 medarbejderes viden til at udvikle og levere biobaserede ingredienser, der imødekommer markedets efterspørg-sel efter sundere og sikrere produkter. Med udgangspunkt i vores hovedkontor i Danmark og aktiviteter på mere end 120 lokationer er Daniscos hovedfokus at blive vores kunders ‘First choice’ og en helt igennem markedsdrevet, global forretning. Yderligere oplysninger fås på www.danisco.com/jobs.

Klik

rekl

amen

Page 48: Statistik - Gratis Kompendium - manan.dkmanan.dk/wp-content/uploads/2014/03/brink_david_statistik... · Statistisk testteori 7.1 Nulhypotese og alternativ hypotese 7.2 SigniÞ kanssandsynlighed

Download gratis bøger på ventus.dk / BookBooN.com

48

Lær Nemt! Statistik Normalfordelingen

15.5 Regneregler for Φ

Fordelingsfunktionen Φ for en standardnormalfordelt stokastisk variabel X ∼ N(0, 1) opfylder

P (X ≤ x) = Φ(x)

P (X ≥ x) = Φ(−x)

P (|X| ≤ x) = Φ(x)− Φ(−x)

P (|X| ≥ x) = 2 · Φ(−x)

Φ(−x) = 1− Φ(x)

15.6 Estimation af middelværdien μ

Antag x1, x2, . . . , xn er uafhængige observationer fra en stokastisk variabel X ∼ N(μ, σ2). Mak-simum likelihood-estimatet (ML-estimatet) pa μ er

μ =x1 + · · ·+ xn

n.

Dette kaldes ogsa blot gennemsnittet og skrives x. Gennemsnittet er en middelret estimator pa μ

(dvs. at estimatorens middelværdi er μ). Variansen pa gennemsnittet er

var2(x) =σ2

n.

Mere præcist gælder, at x selv er normalfordelt:

x ∼ N(μ,σ2

n) .

15.7 Estimation af variansen σ2

Antag x1, . . . , xn er uafhængige observationer fra en stokastisk variabel X ∼ N(μ, σ2). Normalt

estimerer man variansen σ2 vha. den empiriske varians

s2 =∑

(xi − x)2

n− 1

Den empiriske varians s2 er en middelret estimator pa den sande varians σ2.

Advarsel: Den empiriske varians er ikke maksimum likelihood-estimatet pa σ2. Maksimum likelihood-

estimatet pa σ2 er ∑(xi − x)2

n

men man bruger den sjældent, da den ikke er middelret og oftest estimerer for lavt.

Page 49: Statistik - Gratis Kompendium - manan.dkmanan.dk/wp-content/uploads/2014/03/brink_david_statistik... · Statistisk testteori 7.1 Nulhypotese og alternativ hypotese 7.2 SigniÞ kanssandsynlighed

Download gratis bøger på ventus.dk / BookBooN.com

49

Lær Nemt! Statistik Normalfordelingen

15.8 Konfidensinterval for middelværdien μ

Antag x1, . . . , xn er uafhængige observationer fra en normalfordelt stokastisk variabel X ∼N(μ, σ2), og at vi vil estimere middelværdien μ. Hvis variansen σ2 er kendt, er konfidensin-

tervallet for μ med konfidensgrad 1− α:[x− u1−α/2

σ√n

, x + u1−α/2σ√n

]Tallet u1−α/2 er fastlagt ved Φ(u1−α/2) = 1− α/2, hvor Φ er fordelingsfunktionen for standard-

normalfordelingen. Det fremgar fx af Tabel C.2, at for konfidensgrad 95% er

u1−α/2 = u0,975 = 1,96 .

Hvis variansen σ2 er ukendt, er konfidensintervallet for μ med konfidensgrad 1− α:[x− t1−α/2(n− 1)

√s2

n, x + t1−α/2(n− 1)

√s2

n

]

hvor s2 er den empiriske varians (afsnit 6.3). Tallet t1−α/2 er fastlagt ved F (u1−α/2) = 1− α/2,

hvor F er fordelingsfunktionen for Student’s t-fordeling med n− 1 frihedsgrader. Det fremgar fx

af Tabel C.4, at for konfidensgrad 95% haves

n 2 3 4 5 6 7 8 9 10 11 12t1−α/2 12,7 4,30 3,18 2,78 2,57 2,45 2,36 2,31 2,26 2,23 2,20

15.9 Konfidensinterval for variansen σ2 og spredningen σ

Antag x1, . . . , xn er uafhængige observationer fra en normalfordelt stokastisk variabel X ∼N(μ, σ2). Konfidensintervallet for variansen σ2 med konfidensgrad 1− α er:[

(n− 1)s2

χ2α/2

,(n− 1)s2

χ21−α/2

]

hvor s2 er den empiriske varians (afsnit 6.3). Tallene χ2α/2 og χ2

1−α/2 er fastlagt ved F (χ2α/2) =

α/2 og F (χ21−α/2) = 1 − α/2, hvor F er fordelingsfunktionen for χ2-fordelingen med n − 1

frihedsgrader (Tabel C.3).

Konfidensintervallet for spredningen σ med konfidensgrad 1−α fas ganske enkelt ved at tage

kvadratroden af grænserne i konfidensintervallet for variansen:[ √(n− 1)s2

χ2α/2

,

√(n− 1)s2

χ21−α/2

]

15.10 Additionsformlen

En lineær funktion af en normalfordelt stokastisk variabel er selv normalfordelt. Hvis med andre

ord X ∼ N(μ, σ2) og a, b ∈ R (a = 0), sa er

aX + b ∼ N(aμ + b, a2σ2) .

Summen af uafhængige normalfordelte stokastiske variable er selv normalfordelt. Hvis med

andre ord X1, . . . , Xn er uafhængige med Xi ∼ N(μi, σ2i ), sa er

X1 + · · ·+ Xn ∼ N(μ1 + · · ·+ μn, σ21 + · · ·+ σ2

n) .

Page 50: Statistik - Gratis Kompendium - manan.dkmanan.dk/wp-content/uploads/2014/03/brink_david_statistik... · Statistisk testteori 7.1 Nulhypotese og alternativ hypotese 7.2 SigniÞ kanssandsynlighed

Download gratis bøger på ventus.dk / BookBooN.com

50

Lær Nemt! Statistik Fordelinger knyttet til normalfordelingen

16 Fordelinger knyttet til normalfordelingen

16.1 χ2-fordelingen

Lad X1, . . . , Xn ∼ N(0, 1) være uafhængige standardnormalfordelte stokastiske variable. Forde-

lingen af kvadratsummen

Q = X21 + · · ·+ X2

n

kaldes χ2-fordelingen med n frihedsgrader. Antallet af frihedsgrader skrives normalt df (degre-es of freedom).

En χ2-fordelt stokastik variabel Q med df frihedsgrader har middelværdi

E(Q) = df

og variansvar(Q) = 2 · df .

Som studerende kan man godt mangle nogle praktiske værktøjer – det kan DJØFs studiekurserhjælpe med. Og så er det helt gratis. Det giver dig lige det ekstra at tage et kursus i Excel eller Præsentations-teknik, og så får du samtidig udvidet dit netværk på studiet.

LÆS MERE PÅ DJOEF.DK/STUDERENDE

Danmarks måske stærkeste netværk

Brug for faglige vitaminer?

Klik

rekl

amen

Page 51: Statistik - Gratis Kompendium - manan.dkmanan.dk/wp-content/uploads/2014/03/brink_david_statistik... · Statistisk testteori 7.1 Nulhypotese og alternativ hypotese 7.2 SigniÞ kanssandsynlighed

Download gratis bøger på ventus.dk / BookBooN.com

51

Lær Nemt! Statistik Fordelinger knyttet til normalfordelingen

χ2-fordelingens tæthed f(x) er

f(x) = K · xdf

2−1 · e−

x

2

hvor df er antallet af frihedsgrader, og K er en konstant. I praksis bruger man ikke tætheden,

men slar fordelingsfunktionen op i Tabel C.3. Nedenstaende graf viser tæthedsfunktionen med

df = 1, 4, 10, 20 frihedsgrader.

df=1

df=4

df=10

df=20

16.2 Student’s t-fordeling

Lad X være en normalfordelt stokastisk variabel med middelværdi μ og varians σ2. Lad de

stokastiske variable X og S2 være henholdsvis gennemsnit og empirisk varians for en stikprøve

bestaende af n observationer fra X . Fordelingen af

T =X − μ√

S2/n

er da uafhængig af bade μ og σ2 og kaldes Student’s t-fordeling med n− 1 frihedsgrader.

En t-fordelt stokastik variabel T med df frihedsgrader har middelværdi

E(T ) = 0

for df ≥ 2 og varians

var(T ) =df

df − 2

for df ≥ 3.

t-fordelingens tæthed f(x) er

f(x) = K ·(

1 +x2

df

)−(df+1)/2

hvor df er antallet af frihedsgrader, og K er en konstant. I praksis bruger man ikke tætheden, men

slar fordelingsfunktionen op i Tabel C.4. Nedenstaende graf viser tætheden for t-fordelingen med

df = 1, 2, 3 frihedsgrader samt tætheden ϕ(x) for standardnormalfordelingen. Som man kan se,

Page 52: Statistik - Gratis Kompendium - manan.dkmanan.dk/wp-content/uploads/2014/03/brink_david_statistik... · Statistisk testteori 7.1 Nulhypotese og alternativ hypotese 7.2 SigniÞ kanssandsynlighed

Download gratis bøger på ventus.dk / BookBooN.com

52

Lær Nemt! Statistik Fordelinger knyttet til normalfordelingen

nærmer t-fordelingen sig standardnormalfordelingen, nar df →∞.

df=3

df=2

df=1

(x)

16.3 Fisher’s F -fordeling

Lad X1 og X2 være uafhængige normalfordelte stokastiske variable med samme varians. Lad for

i = 1, 2 den stokastiske variabel S2i være den empiriske varians af en stikprøve af størrelse ni fra

Xi. Fordelingen af kvotienten

V =S2

1

S22

kaldes Fisher’s F -fordeling med n1 − 1 frihedsgrader i tælleren og n2 − 1 frihedsgrader inævneren.

F -fordelingens tæthed f(x) er

f(x) = K · xdf1/2−1

(df2 + df1x)df/2

hvor K er en konstant, df1 er antal frihedsgrader i tæller, df2 er antal frihedsgrader i nævner og

df = df1 +df2. I praksis bruger man ikke tætheden, men slar fordelingsfunktionen op i Tabel C.5.

17 Test i normalfordelingen

17.1 En stikprøve, kendt varians, H0 : μ = μ0

Lad der være givet en stikprøve x1, . . . , xn af n uafhængige observationer fra en normalfordeling

med ukendt middelværdi μ og kendt varians σ2. Vi vil teste nulhypotesen

H0 : μ = μ0 .

Hertil beregnes teststørrelsen

u =√

n(x− μ0)σ

=∑n

i=1 xi − nμ0√nσ2

.

Page 53: Statistik - Gratis Kompendium - manan.dkmanan.dk/wp-content/uploads/2014/03/brink_david_statistik... · Statistisk testteori 7.1 Nulhypotese og alternativ hypotese 7.2 SigniÞ kanssandsynlighed

Download gratis bøger på ventus.dk / BookBooN.com

53

Lær Nemt! Statistik Test i normalfordelingen

17 Test i normalfordelingen

17.1 En stikprøve, kendt varians, H0 : μ = μ0

Lad der være givet en stikprøve x1, . . . , xn af n uafhængige observationer fra en normalfordeling

med ukendt middelværdi μ og kendt varians σ2. Vi vil teste nulhypotesen

H0 : μ = μ0 .

Hertil beregnes teststørrelsen

u =√

n(x− μ0)σ

=∑n

i=1 xi − nμ0√nσ2

.

Signifikanssandsynligheden ses nu af følgende skema, hvor Φ er fordelingsfunktionen for stan-

dardnormalfordelingen (Tabel C.2).

Alternativ Signifikans–

hypotese sandsynlighed

H1 : μ > μ0 Φ(−u)H1 : μ < μ0 Φ(u)H1 : μ = μ0 2 · Φ(−|u|)

Normalt forkastes H0, hvis signifikanssandsynligheden er mindre end 5%.

17.2 En stikprøve, ukendt varians, H0 : μ = μ0 (Student’s t-test)

Lad der være givet en stikprøve x1, . . . , xn af n uafhængige observationer fra en normalfordeling

med ukendt middelværdi μ og ukendt varians σ2. Vi vil teste nulhypotesen

H0 : μ = μ0 .

Hertil beregnes teststørrelsen

t =√

n(x− μ0)s

=∑n

i=1 xi − nμ0√n · s2

,

hvor s2 er den empiriske varians (se afsnit 6.3).

Page 54: Statistik - Gratis Kompendium - manan.dkmanan.dk/wp-content/uploads/2014/03/brink_david_statistik... · Statistisk testteori 7.1 Nulhypotese og alternativ hypotese 7.2 SigniÞ kanssandsynlighed

Download gratis bøger på ventus.dk / BookBooN.com

54

Lær Nemt! Statistik Test i normalfordelingen

Signifikanssandsynligheden ses nu af følgende skema, hvor FStudent er fordelingsfunktionen

for Student’s t-fordeling med df = n− 1 frihedsgrader (Tabel C.4).

Alternativ Signifikans–

hypotese sandsynlighed

H1 : μ > μ0 1− FStudent(t)H1 : μ < μ0 1− FStudent(−t)H1 : μ = μ0 2 · (1− FStudent(|t|))

Normalt forkastes H0, hvis signifikanssandsynligheden er mindre end 5%.

EKSEMPEL. Rektor ved Rysensteen Gymnasium ønsker at bekræfte statistisk, at hendes elever

ved studentereksamen 2006 har klaret sig signifikant miserabelt. Til dette formal udvælges n = 10studenter tilfældigt. Deres gennemsnit er

x1 x2 x3 x4 x5 x6 x7 x8 x9 x10

7, 6 7, 7 7, 5 5, 8 5, 7 7, 9 5, 4 6, 7 7, 9 9, 4

Landsgennemsnittet for 2006 er 8,27. Man kan med rimelighed antage, at gennemsnittene er nor-

malfordelte. Variansen er imidlertid ukendt. Vi benytter derfor Student’s t-test og vil teste nul-

hypotesen

H0 : μ = 8,27

mod den alternative hypotese

H1 : μ < 8,27 .

Vi beregner observationernes gennemsnit x = 7, 17 og empiriske spredning s = 1, 26 og finder

teststørrelsen

t =√

10(7, 17− 8, 27)1, 26

= −2,76 .

Et opslag i Tabel C.4 under df = n− 1 = 9 frihedsgrader giver en signifikanssandsynlighed

1− FStudent(−t) = 1− FStudent(2,76)

mellem 1% og 2,5%. Vi kan altsa forkaste H0 til fordel for Rektors formodning, om at hendes

elever har klaret sig signifikant ringere end resten af landet.

17.3 En stikprøve, ukendt middelværdi, H0 : σ2 = σ20

SÆTNING. Lad der være givet n (uafhængige) observationer x1, . . . , xn fra en normalfordeling

med varians σ2. Da er teststørrelsen

q =(n− 1)s2

σ2=

∑ni=1(xi − x)2

σ2

χ2-fordelt med df = n− 1 frihedsgrader (her er s2 den empiriske varians).

Page 55: Statistik - Gratis Kompendium - manan.dkmanan.dk/wp-content/uploads/2014/03/brink_david_statistik... · Statistisk testteori 7.1 Nulhypotese og alternativ hypotese 7.2 SigniÞ kanssandsynlighed

Download gratis bøger på ventus.dk / BookBooN.com

55

Lær Nemt! Statistik Test i normalfordelingen

Lad der være givet en stikprøve x1, . . . , xn af n uafhængige observationer fra en normalfordeling

med ukendt middelværdi μ og ukendt varians σ2. Vi vil teste nulhypotesen

H0 : σ2 = σ20 .

Hertil beregnes teststørrelsen

q =(n− 1)s2

σ20

=∑n

i=1(xi − x)2

σ20

,

hvor s2 er den empiriske varians.

Signifikanssandsynligheden ses nu af følgende skema, hvor Fχ2 er fordelingsfunktionen for

χ2-fordelingen med df = n− 1 frihedsgrader. (Tabel C.3).

Alternativ Signifikans–

hypotese sandsynlighed

H1 : σ2 > σ20 1− Fχ2(q)

H1 : σ2 < σ20 Fχ2(q)

H1 : σ2 = σ20 2 ·min{Fχ2(q), 1− Fχ2(q)}

Normalt forkastes H0, hvis signifikanssandsynligheden er mindre end 5%.

Bemærk: I praksis testes altid mod den alternative hypotese H1 : σ2 > σ20 .

17.4 Eksempel

Betragt følgende 20 observationer stammende fra en normalfordeling med ukendt middelværdi og

varians:91 97 98 112 91 97 116 108 108 100

107 98 92 103 100 99 98 104 104 97

Vi vil teste nulhypotesen

H0: spredningen er højst 5 (dvs. variansen er højst 25)

mod den alternative hypotese

H1: spredningen er større end 5 (dvs. variansen er større end 25).

Den empiriske varians beregnes til s2 = 45,47, og dermed finder vi teststørrelsen

q =(20− 1) · 45,47

52= 34,56 .

Opslag i tabel C.3 under df = 19 frihedsgrader viser, signifikanssandsynlighed omkring er 2%.

Vi kan dermed afvise H0.

(Rent faktisk stammer observationerne fra en normalfordeling med middelværdi μ = 100 og

spredning σ = 6. Testet er altsa bemærkelsesværdigt følsomt.)

Page 56: Statistik - Gratis Kompendium - manan.dkmanan.dk/wp-content/uploads/2014/03/brink_david_statistik... · Statistisk testteori 7.1 Nulhypotese og alternativ hypotese 7.2 SigniÞ kanssandsynlighed

Download gratis bøger på ventus.dk / BookBooN.com

56

Lær Nemt! Statistik Test i normalfordelingen

17.5 To stikprøver, kendte varianser, H0 : μ1 = μ2

Lad der være givet en stikprøve x1, . . . , xn fra en normalfordeling med ukendt middelværdi μ1

og kendt varians σ21 . Lad der desuden være givet en stikprøve y1, . . . , ym fra en normalfordeling

med ukendt middelværdi μ2 og kendt varians σ22 . Det antages, at de to stikprøver er uafhængige

af hinanden.

Vi vil teste nulhypotesen

H0 : μ1 = μ2 .

Hertil beregnes teststørrelsen

u =x− y√

σ21/n + σ2

2/m.

Signifikanssandsynligheden ses nu af følgende skema, hvor Φ er fordelingsfunktionen for stan-

dardnormalfordelingen (Tabel C.3).

Alternativ Signifikans–

hypotese sandsynlighed

H1 : μ1 > μ2 Φ(−u)H1 : μ1 < μ2 Φ(u)H1 : μ1 = μ2 2 · Φ(−|u|)

Normalt forkastes H0, hvis signifikanssandsynligheden er mindre end 5%.

Bemærk: I praksis er forudsætningerne for dette test sjældent til stede.

We challenge you to come closer

At Coloplast, we work closely with doctors, nurses and end users to develop medical devices and services that make life easier for people with intimate healthcare needs.

We’re looking for people full of potential – and we reward talent and performance with challenging career opportunities. We offer strong leadership – and together, we will nurture your talent to speed your devel-opment as well as our own.

We challenge you to take a closer look at www.coloplast.com

Coloplast.com/jobs »

Klik

rekl

amen

Page 57: Statistik - Gratis Kompendium - manan.dkmanan.dk/wp-content/uploads/2014/03/brink_david_statistik... · Statistisk testteori 7.1 Nulhypotese og alternativ hypotese 7.2 SigniÞ kanssandsynlighed

Download gratis bøger på ventus.dk / BookBooN.com

57

Lær Nemt! Statistik Test i normalfordelingen

17.6 To stikprøver, ukendte varianser, H0 : μ1 = μ2 (Fisher-Behrens)

Lad situationen være som i afsnit 17.5, men antag, at varianserne σ21 og σ2

2 er ukendte. Problemet,

at finde en passende teststørrelse til afprøvning af nulhypotesen

H0 : μ1 = μ2 ,

kaldes Fisher-Behrens-problemet og har ikke nogen tilfredsstillende løsning.

Hvis n, m > 30, kan man dog kopiere testet i afsnit 17.5 med den alternative teststørrelse

u∗ =x− y√

s21/n + s2

2/m,

hvor s21 og s2

2 er de empiriske varianser for x’erne henholdsvis y’erne.

17.7 To stikprøver, ukendte middelværdier, H0 : σ21 = σ2

2

Lad der være givet en stikprøve x1, . . . , xn fra en normalfordeling med ukendt middelværdi μ1

og ukendt varians σ21 . Lad der desuden være givet en stikprøve y1, . . . , ym fra en normalfor-

deling med ukendt middelværdi μ2 og ukendt varians σ22 . Det antages, at de to stikprøver er

uafhængige af hinanden.

Vi vil teste nulhypotesen

H0 : σ1 = σ2 .

Hertil beregnes teststørrelsen

v =s21

s22

=x’ernes empiriske varians

y’ernes empiriske varians.

Desuden sættes

v∗ = max{

v,1v

}.

Signifikanssandsynligheden ses nu af følgende skema, hvor FFisher er fordelingsfunktionen for

Fishers F -fordeling med n− 1 frihedsgrader i tælleren og m− 1 frihedsgrader i nævneren (Tabel

C.5).

Alternativ Signifikans–

hypotese sandsynlighed

H1 : σ21 > σ2

2 1− FFisher(v)H1 : σ2

1 < σ22 1− FFisher(1/v)

H1 : σ21 = σ2

2 2 · (1− FFisher(v∗))

Normalt forkastes H0, hvis signifikanssandsynligheden er mindre end 5%.

Hvis H0 accepteres, estimeres den fælles varians σ21 = σ2

2 af den “poolede” varians

s2pool =

∑ni=1(xi − x)2 +

∑mi=1(yi − y)2

n + m− 2=

(n− 1)s21 + (m− 1)s2

2

n + m− 2.

Page 58: Statistik - Gratis Kompendium - manan.dkmanan.dk/wp-content/uploads/2014/03/brink_david_statistik... · Statistisk testteori 7.1 Nulhypotese og alternativ hypotese 7.2 SigniÞ kanssandsynlighed

Download gratis bøger på ventus.dk / BookBooN.com

58

Lær Nemt! Statistik Test i normalfordelingen

17.8 To stikprøver, ukendt fælles varians, H0 : μ1 = μ2

Lad der være givet en stikprøve x1, . . . , xn fra en normalfordeling med ukendt middelværdi μ1

og ukendt varians σ2. Lad der desuden være givet en stikprøve y1, . . . , ym fra en normalfor-

deling med ukendt middelværdi μ2 og samme varians σ2. Det antages, at de to stikprøver er

uafhængige af hinanden.

Vi vil teste nulhypotesen

H0 : μ1 = μ2 .

Hertil beregnes teststørrelsen

t =x− y√

(1/n + 1/m)s2pool

hvor s2pool er den “poolede” varians som givet i afsnit 17.7.

Signifikanssandsynligheden ses nu af følgende skema, hvor FStudent er fordelingsfunktionen

for Student’s t-fordeling med n + m− 2 frihedsgrader (Tabel C.4).

Alternativ Signifikans–

hypotese sandsynlighed

H1 : μ1 > μ2 1− FStudent(t)H1 : μ1 < μ2 1− FStudent(−t)H1 : μ1 = μ2 2 · (1− FStudent(|t|))

Normalt forkastes H0, hvis signifikanssandsynligheden er mindre end 5%.

17.9 Eksempel (sammenligning af to middelværdier)

Antag vi har givet 7 uafhængige observationer fra en normalfordelt stokastisk variabel X:

x1 = 26 , x2 = 21 , x3 = 15 , x4 = 7 , x5 = 15 , x6 = 28 , x7 = 21 .

samt 4 uafhængige observationer fra en normaltfordelt stokastisk variabel Y :

y1 = 29 , y2 = 31 , y3 = 17 , y4 = 22 .

Vi vil teste hypotesen

H0 : E(X) = E(Y ) .

For at kunne dette, ma vi først teste, om X og Y har samme varians. Vi tester altsa hjælpehy-

potesen

H∗0 : var(X) = var(Y )

mod alternativet

H∗1 : var(X) = var(Y ) .

Hertil beregnes som i afsnit 17.7 teststørrelsen

v =s21

s22

=52,341,6

= 1,26

Page 59: Statistik - Gratis Kompendium - manan.dkmanan.dk/wp-content/uploads/2014/03/brink_david_statistik... · Statistisk testteori 7.1 Nulhypotese og alternativ hypotese 7.2 SigniÞ kanssandsynlighed

Download gratis bøger på ventus.dk / BookBooN.com

59

Lær Nemt! Statistik Test i normalfordelingen

samt

v∗ = max{

v,1v

}= 1,26 .

Et opslag i Tabel C.5 med 7 − 1 = 6 frihedsgrader i tælleren og 4 − 1 = 3 frihedsgrader i

nævneren viser, at signifikanssandsynligheden er klart større end 20%, og vi kan derfor acceptere

hjælpehypotesen H∗0.

Vi vender nu tilbage til testet af H0 mod den alternative hypotese

H1 : E(X) = E(Y ) .

Den “poolede” varians findes til

s2pool =

6s21 + 3s2

2

9= 48,8 .

Teststørrelsen bliver dermed

t =x− y√

(1/7 + 1/4)s2pool

=19− 24,8√

(1/7 + 1/4)48,8= −1,31 .

Signifikanssandsynligheden fas derfor til

2 · (1− FStudent(|t|)) = 2 · (1− FStudent(1,31)) ≈ 2 · (1− 0,90) = 20%

idet vi slar Student’s t-fordeling med 7 + 4− 2 = 9 frihedsgrader op i Tabel C.4. Vi kan dermed

ikke forkaste H0.

Forvent mere

I TDC bliver du en del af en udviklende og attraktiv arbejdsplads, der giver dig mulighed for at leve både job-livet og privatlivet fuldt ud. Som TDC’er bliver du tilbudt udfordrende arbejdsopgaver, løbende uddannelse og mulighed for at udleve dine karrieredrømme gennem vores professionelle udviklingsprogrammer. Samtidig sætter vi rammerne for, at du kan skabe balance i dit liv og giver gode arbejdsvilkår til alle, om du er nybagt far eller kvindelig leder. Vi er rygraden i det danske it- og kommunikationssamfund. Det vil vi også være i morgen - og som TDC’er kan du være med til at udstikke kursen. Lyder det som noget for dig?

Læs mere på tdc.dk/job

Hos TDC har vi en særlig evne

til at forkorte vejen fra ledertalent til leder.

Klik

rekl

amen

Page 60: Statistik - Gratis Kompendium - manan.dkmanan.dk/wp-content/uploads/2014/03/brink_david_statistik... · Statistisk testteori 7.1 Nulhypotese og alternativ hypotese 7.2 SigniÞ kanssandsynlighed

Download gratis bøger på ventus.dk / BookBooN.com

60

Lær Nemt! Statistik Variansanalyse

18 Variansanalyse

18.1 Formal

Variansanalyse, ogsa kaldet ANOVA (analysis of variance), er en metode til sammenligning af

gennemsnittene af flere end 2 stikprøver. Variansanalyse er en naturlig forlængelse af testene i

forrige kapitel.

18.2 k stikprøver, ukendt fælles varians, H0 : μ1 = · · · = μk

Lad X1, . . . , Xk være k uafhængige, normalfordelte stokastiske variable med middelværdier μ1, . . . , μk

og fælles varians σ2. Lad der fra hver Xi være givet en stikprøve bestaende af ni observationer.

Lad xj og s2j være gennemsnit og empirisk varians af stikprøven fra Xj .

Vi vil teste nulhypotesen

H0 : μ1 = · · · = μk

mod alle andre hypoteser. Til dette formal estimeres den fælles varians σ2 pa to forskellige mader.

Variansestimatet inden for stikprøverne er

s2I =

1n− k

k∑j=1

(nj − 1)s2j .

Variansestimatet mellem stikprøverne er

s2M =

1k − 1

k∑j=1

nj(xj − x)2 .

s2I estimerer σ2, uanset om H0 er sand eller ej. s2

M estimerer kun σ2, hvis H0 er sand. Hvis H0 er

falsk, estimerer s2M for højt.

Betragt nu teststørrelsen

v =s2M

s2I

.

Signifikanssandsynligheden er

1− FFisher(v)

hvor FFisher er fordelingsfunktionen for Fishers F -fordeling med k− 1 frihedsgrader i tælleren og

n− k frihedsgrader i nævneren (Tabel C.5).

18.3 To eksempler (sammenligning af middelværdier i 3 stikprøver)

Lad der være givet 3 stikprøver

1. stikprøve: 29, 28, 29, 21, 28, 22, 22, 29, 26, 26

2. stikprøve: 22, 21, 18, 28, 23, 25, 25, 28, 23, 26

3. stikprøve: 24, 23, 26, 20, 33, 23, 26, 24, 27, 22

Page 61: Statistik - Gratis Kompendium - manan.dkmanan.dk/wp-content/uploads/2014/03/brink_david_statistik... · Statistisk testteori 7.1 Nulhypotese og alternativ hypotese 7.2 SigniÞ kanssandsynlighed

Download gratis bøger på ventus.dk / BookBooN.com

61

Lær Nemt! Statistik Variansanalyse

Det antages, at stikprøverne stammer fra uafhængige normalfordelinger med fælles varians. Lad

μi være middelværdien af den i’te normalfordeling. Vi vil teste nulhypotesen

H0 : μ1 = μ2 = μ3 .

(Rent faktisk stammer alle observationerne fra en normalfordeling med middelværdi 25 og varians

10, sa testet bør ikke føre til forkastelse af H0). Vi har altsa k = 3 stikprøver med hver ni = 10observationer, i alt n = 30 observationer. En udregning giver følgende variansestimat inden forstikprøverne:

s2I = 10,91

og følgende variansestimat mellem stikprøverne:

s2M = 11,10

(Da vi ved, at H0 er sand, bør bade s2I og s2

M estimere σ2 = 10, hvilket ogsa passer ganske godt).

Nu beregnes teststørrelsen:

v =s2M

s2I

=11,1010,91

= 1,02 .

Opslag i Tabel C.5 under k−1 = 2 frihedsgrader i tælleren og n−k = 27 frihedsgrader i nævneren

viser, at signifikanssandsynligheden er over 10%. Nulhypotesen H0 ma altsa opretholdes.

Lidt mere udførligt kan udregningerne opsummeres i et skema som følger:

Stikprøve nummer 1. 2. 3.29 22 24

28 21 23

29 18 26

21 28 20

28 23 33

22 25 23

22 25 26

29 28 24

26 23 27

26 26 22

Gennemsnit xj 26,0 23,9 24,8

Empirisk varians s2j 10,22 9,88 12,62

x = 24, 9 (samlet gennemsnit)

s2I = (s2

1 + s22 + s2

3)/3 = 10,91 (varians inden for stikprøverne)

s2M = 5

∑(xj − x)2 = 11,10 (varians mellem stikprøverne)

v = s2M/s2

I = 1,02 (teststørrelsen)

Hvis vi lægger 5 til alle observationerne i stikprøve nummer 3, far vi i stedet følgende skema:

Page 62: Statistik - Gratis Kompendium - manan.dkmanan.dk/wp-content/uploads/2014/03/brink_david_statistik... · Statistisk testteori 7.1 Nulhypotese og alternativ hypotese 7.2 SigniÞ kanssandsynlighed

Download gratis bøger på ventus.dk / BookBooN.com

62

Lær Nemt! Statistik Variansanalyse

Stikprøve nummer 1. 2. 3.29 22 29

28 21 28

29 18 31

21 28 25

28 23 38

22 25 28

22 25 31

29 28 29

26 23 32

26 26 27

Gennemsnit xj 26,0 23,9 29,8

Empirisk varians s2j 10,22 9,88 12,62

x = 26,6 (samlet gennemsnit)

s2I = (s2

1 + s22 + s2

3)/3 = 10,91 (varians inden for stikprøverne)

s2M = 5

∑(xj − x)2 = 89,43 (varians mellem stikprøverne)

v = s2M/s2

I = 8,20 (teststørrelsen)

Bemærk hvordan variansen inden for stikprøverne ikke ændrer sig, hvorimod variansen mellem

stikprøverne nu er alt for stor. Dermed bliver teststørrelsen v = 8,20 ogsa stor, og signifikans-

sandsynligheden ses i Tabel C.5 at være mindre end 1%. Dermed forkastes nulhypotesen H0 om

ens middelværdier (hvilket var at forvente, da H0 rent faktisk er falsk).

Introduktionspris:

Få både A-kasse & fagforening for kun 388 kr.

Det betaler sig!

Vidste du at som demittend skal du melde dig ind senest 14 efter din sidste eksamen for at være berettiget til dagpenge?

Som medlem af LAK får du:

Ret til dagpenge allerede 1 måned efter din udd. afslutning

Ret til dagpenge i en samlet periode på 4 år

Mulighed for at få din ansættelseskontrakt tjekket

Adgang til website for at tjekke gennemsnitsløn på dit områd

Heltidsulykkesforsikring til 37,50 kr. om måneden efter endt uddannelse

Gennemgang af ansøgning og CV af en af vores kompetente jobkonsulenter

Individuel coaching

www.lakonline.dk

Spring videre til www.lakonline.dk eller ring 3330 4484

Klik

rekl

amen

Page 63: Statistik - Gratis Kompendium - manan.dkmanan.dk/wp-content/uploads/2014/03/brink_david_statistik... · Statistisk testteori 7.1 Nulhypotese og alternativ hypotese 7.2 SigniÞ kanssandsynlighed

Download gratis bøger på ventus.dk / BookBooN.com

63

Lær Nemt! Statistik Chi-kvadrat (χ2)

19 Chi-kvadrat χ2

19.1 χ2-test for fordelingslighed

Grunden til, at χ2-fordelingen er sa vigtig, er, at den kan bruges til at teste, om et forelagt sæt

af observationer kan tænkes at stamme fra en bestemt fordeling. I de næste afsnit skal vi se

eksempler pa dette. Testet, som ogsa kaldes Pearson’s χ2-test eller χ2-test for goodness of fit,udføres saledes:

1. Først inddeles observationerne i kategorier. Lad os kalde antallet af kategorier for k, og antallet

af observationer i den i’te kategori for Oi. Det samlede antal observationer er altsa n = O1 +· · ·+ Ok.

2. Opstil en nul-hypotese H0. Nul-hypotesen skal fortælle, hvad sandsynligheden pi er, for at en

observation havner i den i’te kategori.

3. Udregn teststørrelsen

χ2 =k∑

i=1

(Oi − Ei)2

Ei

Oi er som sagt det observerede antal i den i’te kategori. Ei er det (under nul-hypotesen) forventede(’expected’) antal i den i’te kategori: Ei = npi. Teststørrelsen χ kaldes i øvrigt nogle gange

diskrepansen.

4. Find signifikanssandsynligheden

P = 1− F (χ2),

hvor F = Fχ2 er fordelingsfunktionen for χ2-fordelingen med df frihedsgrader (slas op i Tabel

C.3). H0 forkastes, hvis P er mindre end 5% (eller hvad man nu har valgt som signifikansniveau).

Antallet af frihedsgrader er normalt df = k − 1, altsa 1 mindre end antallet af kategorier. Hvis

man bruger observationerne til at estimere nul-hypotesens sandsynlighedsparametre pi, bliver df

dog mindre.

Huskeregel. Hver parameter, der estimeres, koster en frihedsgrad.

Bemærk: Det er logisk at forkaste H0, hvis χ2 er stor, thi det betyder jo, at forskellen mellem de

observerede og de forventede antal er stor.

19.2 Normalfordelingsantagelse

Da χ2-testet hviler pa en normalapproksimation, kan man kun bruge det, hvis der ikke er alt for

fa observationer.

Page 64: Statistik - Gratis Kompendium - manan.dkmanan.dk/wp-content/uploads/2014/03/brink_david_statistik... · Statistisk testteori 7.1 Nulhypotese og alternativ hypotese 7.2 SigniÞ kanssandsynlighed

Download gratis bøger på ventus.dk / BookBooN.com

64

Lær Nemt! Statistik Chi-kvadrat (χ2)

Huskeregel. χ2-testet kan bruges, hvis det forventede antal Ei er mindst 5 i hver kategori. Hvis

der er flere and 5 kategorier, kan man dog nøjes med mindst 3 forventede antal i hver kategori.

19.3 Standardiserede residualer

Hvis nulhypotesen om fordelingslighed forkastes ved et χ2-test, skyldes det, at nogle af de obser-

verede antal afviger ekstremt fra de forventede antal. Det er da interessant at undersøge, præcis

hvilke observerede antal der er ekstreme. Til dette formal beregnes de standardiserede residua-ler

ri =Oi − npi√npi(1− pi)

=Oi − Ei√Ei(1− pi)

for hver kategori. Hvis nulhypotesen var sand, ville hver ri være normalfordelt med middelværdi

μ = 0 og spredning σ = 1. Derfor:

Huskeregel. Standardiserede residualer numerisk større end 2 er tegn pa et ekstremt observeret

antal.

Det kan meget vel tænkes, at der forekommer standardiserede residualer numerisk større end 2,

selvom χ2-testet ikke fører til forkastelse af nulhypotesen. Dette betyder imidlertid ikke, at nul-

hypotesen alligevel skal forkastes. Særligt hvis man har et stort antal kategorier, vil det ikke være

unormalt med enkelte store residualer.

Formaning. Regn kun de standardiserede residualer ud, hvis nulhypotesen er blevet forkastet ved

et χ2-test.

19.4 Eksempel (kvinder med 5 børn)

OPGAVE. Ved en optælling pa Rigshospitalet registreredes børnenes køn for 1045 kvinder, som

havde 5 børn i alt. Resultat:Oi

5 piger 58

4 piger + 1 dreng 149

3 piger + 2 drenge 305

2 piger + 3 drenge 303

1 pige + 4 drenge 162

5 drenge 45

Test den hypotese H0, at der ved hver barnefødsel er lige stor sandsynlighed for en dreng som for

en pige.

SVAR. Hvis H0 holder, bestar ovenstaende tabel af 1045 observationer fra en Bin(5, 1/2)-fordeling.

Page 65: Statistik - Gratis Kompendium - manan.dkmanan.dk/wp-content/uploads/2014/03/brink_david_statistik... · Statistisk testteori 7.1 Nulhypotese og alternativ hypotese 7.2 SigniÞ kanssandsynlighed

Download gratis bøger på ventus.dk / BookBooN.com

65

Lær Nemt! Statistik Chi-kvadrat (χ2)

Punktsandsynlighederne i en Bin(5, 1/2)-fordeling er

pi

5 piger 0,0313

4 piger + 1 dreng 0,1563

3 piger + 2 drenge 0,3125

2 piger + 3 drenge 0,3125

1 pige + 4 drenge 0,1563

5 drenge 0,0313

De forventede antal Ei = 1045 · pi bliver da

Ei

5 piger 32,7

4 piger + 1 dreng 163,3

3 piger + 2 drenge 326,6

2 piger + 3 drenge 326,6

1 pige + 4 drenge 163,3

5 drenge 32,7

Teststørrelsen udregnes:

χ2 =(58− 32,7)2

32,7+

(149− 163,3)2

163,3+

(305− 326,6)2

326,6+

(303− 326,6)2

326,6+

(162− 163,3)2

163,3+

(45− 32,7)2

32,7= 28,6 .

Da observationerne er inddelt i 6 kategorier, sammenligner vi teststørrelsen med χ2-fordelingen

med df = 6 − 1 = 5 frihedsgrader. Opslag i Tabel C.3 viser, at signifikanssandsynligheden er

klart under 0,5%. Vi kan altsa med stor sikkerhed forkaste hypotesen, at dreng-pige-forholdet er

Bin(5, 1/2)-fordelt.

Lad os endelig udregne de standardiserede residualer:

ri

5 piger 4,5

4 piger + 1 dreng –1,2

3 piger + 2 drenge –1,4

2 piger + 3 drenge –1,6

1 pige + 4 drenge –0,1

5 drenge 2,2

Det konstateres, at det er antallene af kvinder med 5 børn af samme køn, som er ekstreme og gør

teststørrelsen stor.

Page 66: Statistik - Gratis Kompendium - manan.dkmanan.dk/wp-content/uploads/2014/03/brink_david_statistik... · Statistisk testteori 7.1 Nulhypotese og alternativ hypotese 7.2 SigniÞ kanssandsynlighed

Download gratis bøger på ventus.dk / BookBooN.com

66

Lær Nemt! Statistik Chi-kvadrat (χ2)

19.5 Eksempel (folketingsvalg)

OPGAVE. Ved folketingsvalget i februar 2005 fordelte stemmeprocenterne sig saledes pa partierne:

A B C F O V Ø Andre

25,8 9,2 10,3 6,0 13,3 29,0 3,4 3,0

I august 2005 foretoges en Gallup-undersøgelse, hvor 1000 tilfældigt udvalgte personer blev s-

purgt, hvem de nu ville stemme pa. Resultatet blev:

A B C F O V Ø Andre

242 89 98 68 141 294 43 25

Har partiernes vælgertilslutning ændret sig siden valget?

SVAR. Vi tester den nul-hypotese H0, at Gallup-undersøgelsens resultat er en observation fra en

multinomialfordeling med k = 8 kategorier og sandsynlighedsparametre pi givet i ovenstaende

skema. De forventede observationer (under nul-hypotesen bliver)

A B C F O V Ø Andre

258 92 103 60 133 290 34 30

Nu kan teststørrelsen χ2 udregnes:

χ2 =8∑

i=1

(Oi − Ei)2

Ei=

(242− 258)2

258+ · · ·+ (25− 30)2

30= 6,15 .

WWW.RADIOMETER.COM/JOBS

Kom tættere på - hvis dit liv skal handle om liv

At arbejde hos Radiometer betyder udfordringer i en international

virksomhed, hvis produkter er med til at redde tusindvis af menneske-

liv hver dag. Vi udvikler og producerer analyseudstyr, der er blandt

verdens bedste og hjælper læger til at stille hurtige og præcise

diagnoser for kritisk syge patienter.

Hos os får du en unik chance for at arbejde i et højteknologisk forsk-

ningsmiljø, hvor videndeling og faglig respekt er med til at gøre

det sjovt og meningsfyldt at gå på arbejde. Lokalt og globalt får du

entusiastiske kolleger, som værdsætter det at gøre en forskel. Lean er

en af hjørnestenene i vores for retningsfilosofi og dermed en naturlig

del af vores hverdag. g

Skal dit liv handle om liv?Gå ind på www.radiometer.com/jobs

Klik

rekl

amen

Page 67: Statistik - Gratis Kompendium - manan.dkmanan.dk/wp-content/uploads/2014/03/brink_david_statistik... · Statistisk testteori 7.1 Nulhypotese og alternativ hypotese 7.2 SigniÞ kanssandsynlighed

Download gratis bøger på ventus.dk / BookBooN.com

67

Lær Nemt! Statistik Chi-kvadrat (χ2)

Opslag i Tabel C.3 under χ2-fordelingen med df = 8 − 1 = 7 frihedsgrader viser, at signifi-

kanssandsynligheden er under 50%. Der er dermed ikke belæg for at konkludere, at partiernes

vælgertilslutning har ændret sig.

Vi vil forbryde os mod formaningen i afsnit 19.3 og regne de standardiserede residualer ud.

For kategori A finder vi fx

r =242− 1000 · 0,258√1000 · 0,258 · 0,742

= −1,16 .

Samlet fasA B C F O V Ø Andre

–1,16 –0,33 –0,52 1,06 0,74 0,28 1,57 –0,93

Ikke overraskende er alle standardiserede residualer numerisk mindre end 2.

19.6 Eksempel (dødsfald i det preussiske kavaleri)

I perioden 1875–1894 registreredes antallet af dødsfald forarsaget af hestespark i 10 af det preus-

siske kavaleris dragonregimenter. Af de i alt 200 regimentsar var der 109 ar uden dødsfald, 65

ar med 1 dødsfald, 22 ar med 2 dødsfald, 3 ar med 3 dødsfald, og 1 ar med 4 dødsfald. Vi vil

undersøge, om disse tal kan stamme fra en Poissonfordeling Pois(λ).For at fa forventede antal (næsten) større end 5, slar vi arene med 3 og 4 dødsfald sammen til

en kategori og har dermed følgende observerede antal Oi af ar med i dødsfald:

i Oi

0 109

1 65

2 22

≥ 3 4

Intensiteten λ estimeres til λ = 122/200 = 0,61, da der i alt er 122 dødsfald i de 200 regimentsar.

Punktsandsynlighederne i en Pois(0,61)-fordeling er

i pi

0 0,543

1 0,331

2 0,101

≥ 3 0,024

De forventede antal bliver dermedi Ei

0 108,7

1 66,3

2 20,2

≥ 3 4,8

Page 68: Statistik - Gratis Kompendium - manan.dkmanan.dk/wp-content/uploads/2014/03/brink_david_statistik... · Statistisk testteori 7.1 Nulhypotese og alternativ hypotese 7.2 SigniÞ kanssandsynlighed

Download gratis bøger på ventus.dk / BookBooN.com

68

Lær Nemt! Statistik Chi-kvadrat (χ2)

Læseren bør lade sig imponere af den slaende lighed mellem forventede og observerede antal! Det

er i grunden overflødigt at regne videre, men lad os alligevel bestemme teststørrelsen

χ2 =(109− 108, 7)2

108, 7+

(65− 66, 3)2

66, 3+

(22− 20, 2)2

20, 2+

(4− 4, 8)2

4, 8= 0,3 .

Da der er 4 kategorier, og vi har estimeret en parameter ud fra data, skal teststørrelsen sammen-

lignes med χ2-fordelingen med df = 4 − 1 − 1 = 2 frihedsgrader. Opslag i Tabel C.3 viser som

ventet en signifikanssandsynlighed klart over 50%.

Eksemplet stammer i øvrigt fra Ladislaus von Bortkiewicz’ bog “Das Gesetz der kleinen Zahlen”

fra 1898.

We have ambitions. Also for you.

SimCorp is a global leader in financial software. At SimCorp, you will be part of a large network of competent

and skilled colleagues who all aspire to reach common goals with dedication and team spirit. We invest in our

employees to ensure that you can meet your ambitions on a personal as well as on a professional level. SimCorp

employs the best qualified people within economics, finance and IT, and the majority of our colleagues have a

university or business degree within these fields.

Ambitious? Look for opportunities at www.simcorp.com/careers

www.simcorp.com

Klik

rekl

amen

Page 69: Statistik - Gratis Kompendium - manan.dkmanan.dk/wp-content/uploads/2014/03/brink_david_statistik... · Statistisk testteori 7.1 Nulhypotese og alternativ hypotese 7.2 SigniÞ kanssandsynlighed

Download gratis bøger på ventus.dk / BookBooN.com

69

Lær Nemt! Statistik Kontingenstabeller

20 Kontingenstabeller

20.1 Definition, metode

Antag der foreligger et antal observationer, og observationerne er inddelt i kategorier efter to

forskellige kriterier. Man kan sa opstille antallet af observationer i hver kategori i en kontingen-stabel. Formalet med det test, der her behandles, er at teste, om der er uafhængighed mellem de

to kriterier, efter hvilke observationerne er inddelt.

METODE. Lad der være givet en r × s-tabel med r rækker og s søjler:

a11 a12 . . . . . . a1s

a21 a22 . . . . . . a2s

......

...

......

...

ar1 ar2 . . . . . . ars

med rækkesummer Ri =∑s

j=1 aij og søjlesummer Sj =∑r

i=1 aij og samlet sum N =∑

i,j aij .

Dette er de observerede antal O. Rækkesandsynlighederne estimeres som

pi· =Ri

N,

og søjlesandsynlighederne estimeres som

p·j =Sj

N.

Hvis der er uafhængighed mellem rækker og søjler, kan cellesandsynlighederne estimeres som

pij = pi·p·j =RiSj

N2.

Vi kan dermed beregne de forventede antal E:

R1S1

N

R1S2

N. . . . . .

R1Ss

N

R2S1

N

R2S2

N. . . . . .

R2Ss

N...

......

......

...

RrS1

N

RrS2

N. . . . . .

RrSs

N

idet det forventede antal i den (i, j)’te celle er

E = Npij = RiSj/N .

Page 70: Statistik - Gratis Kompendium - manan.dkmanan.dk/wp-content/uploads/2014/03/brink_david_statistik... · Statistisk testteori 7.1 Nulhypotese og alternativ hypotese 7.2 SigniÞ kanssandsynlighed

Download gratis bøger på ventus.dk / BookBooN.com

70

Lær Nemt! Statistik Kontingenstabeller

Nu beregnes teststørrelsen

χ2 =∑ (O − E)2

E=

∑ (aij −RiSj/N)2

RiSj/N

hvor der summeres over hver celle i tabellen. Hvis uafhængighedshypotesen holder, og det for-

ventede antal er mindst 5 i hver celle, er teststørrelsen χ2-fordelt med

df = (r − 1)(s− 1)

frihedsgrader.

Vigtigt! Hvis data er givet som procenttal, skal de regnes om til absolutte tal, inden de skrives ind

i kontingenstabellen.

20.2 Standardiserede residualer

Hvis uafhængighedshypotesen forkastes ved et χ2-test, vil man, lige som i afsnit 19.3, være inter-

esseret i at se, i hvilke celler det observerede antal afviger ekstremt fra det forventede antal. De

standardiserede residualer beregnes nu som

rij =Oij −RiSj/n√(

RiSj/n)(

1−Ri/n)(

1− Sj/n)

Hvis uafhængighedshypotesen var sand, ville hver rij være normalfordelt med middelværdi μ = 0og spredning σ = 1. Standardiserede residualer numerisk større end 2 er derfor tegn pa et ekstremt

observeret antal.

20.3 Eksempel (studieretning og politisk orientering)

OPGAVE. Ved en undersøgelse pa 3 danske universiteter blev 488 studerende spurgt, hvilket parti

de ville stemme pa, hvis der var valg i morgen. Resultatet var (i forenklet form):

Soc.dem.Rad. V. Kons. SF DF Venstre Enh.list. Ri

Humaniora 37 48 15 26 4 17 10 157

Nat.videnskab 32 38 19 18 7 51 2 167

Samfundsfag 32 24 15 7 12 69 5 164

Sj 101 110 49 51 23 137 17 488

Undersøg om der er uafhængighed mellem de studerendes studieretning og deres politiske orien-

tering.

SVAR. Vi har at gøre med en 3× 7-tabel og foretager et χ2-test for uafhængighed. Først regnes de

forventede antal

E =RiSj

488ud og opstilles i en tabel:

Soc.dem.Rad. V. Kons. SF DF Venstre Enh.list.

Humaniora 32,5 35,4 15,8 16,4 7,4 44,1 5,5

Nat.videnskab 34,6 37,6 16,8 17,5 7,9 46,9 5,8

Samfundsfag 33,9 37,0 16,5 17,1 7,7 46,0 5,7

Page 71: Statistik - Gratis Kompendium - manan.dkmanan.dk/wp-content/uploads/2014/03/brink_david_statistik... · Statistisk testteori 7.1 Nulhypotese og alternativ hypotese 7.2 SigniÞ kanssandsynlighed

Download gratis bøger på ventus.dk / BookBooN.com

71

Lær Nemt! Statistik Kontingenstabeller

Nu kan teststørrelsen

χ2 =∑ (O − E)2

E

regnes ud, idet de de observerede antal O er tallene i den første tabel:

χ2 =(37− 32,5)2

32,5+ · · ·+ (5− 5,7)2

5,7= 60,9 .

Teststørrelsen skal sammenlignes med χ2-fordelingen med df = (3 − 1)(7 − 1) = 12 friheds-

grader. Et opslag i Tabel C.3 viser, at signifikanssandsynligheden er klart under 0,1%, og vi kan

derfor klart forkaste uafhængighedshypotesen.

Lad os nu beregne de standardiserede residualer for at se, i hvilke celler de observerede antal er

ekstreme. Vi bruger formlen for rij i afsnit 20.2 og far

Soc.dem.Rad. V. Kons. SF DF Venstre Enh.list.

Humaniora 1,1 2,9 –0,2 3,0 –1,6 –5,8 2,4

Nat.videnskab –0,6 0,1 0,7 0,2 –0,4 0,9 –2,0

Samfundsfag –0,5 –3,0 –0,5 –3,2 1,9 4,9 –0,4

Der er altsa ekstreme observationer i mange af cellerne.

BRING YOUR DIFFERENCE

Work, it’s not just about the job. It’s not just about the nine-to-five, the meetings, the conference calls, the e-mails, or even the pay. It’s about much more than that.

British American Tobacco is a truly global organization.Our companies employ more than 53,000 people in a business spanning some 180 markets worldwide.

At British American Tobacco everyone is different, yet with their own unique backgrounds, interests and skills. Combining those differences help us to do amazing things and that’s what makes life interesting!

If you have a passion for Marketing or Finance and are eager to work in a dynamic and stimulating environment, supported by a coach and mentor, then our 2-year International Management Trainee Programme would be a great start to your career.

Deadline for applications is the end of February.

FOR DETAILS ON HOW TO APPLY AND TO FIND OUT MORE PLEASE VISIT www.batgraduatecareers.com

Combining our unique individual talents to do amazing things

Klik

rekl

amen

Page 72: Statistik - Gratis Kompendium - manan.dkmanan.dk/wp-content/uploads/2014/03/brink_david_statistik... · Statistisk testteori 7.1 Nulhypotese og alternativ hypotese 7.2 SigniÞ kanssandsynlighed

Download gratis bøger på ventus.dk / BookBooN.com

72

Lær Nemt! Statistik Kontingenstabeller

20.4 χ2-test for 2× 2-tabeller

En kontingenstabel med 2 rækker og 2 søjler kaldes en 2×2-tabel. Lad os skrive de observerede

antal op saledes:

a b

c d

Teststørrelsen bliver sa

χ2 =(

ad− bc

N

)2 ( 1E11

+1

E12+

1E21

+1

E22

),

hvor N = a + b + c + d er det totale antal observationer, og Eij er det forventede antal i den ij’te

celle. Teststørrelsen χ2 skal sammenholdes med χ2-fordelingen med df = (2 − 1)(2 − 1) = 1frihedsgrad.

Ønskes det at foretage et ensidet test af uafhængighedshypotesen, kan teststørrelsen

u =(

ad− bc

N

)√(1

E11+

1E12

+1

E21+

1E22

)beregnes. Under uafhængighedshypotesen vil u være standardnormalfordelt.

20.5 Fisher’s eksakte test for 2× 2-tabeller

Der er intet i vejen for at bruge χ2-testet pa 2 × 2-tabeller, men der findes et bedre test, kaldet

Fisher’s eksakte test. Fisher’s eksakte test gør ikke brug af nogen normalapproksimation, sa det

kan altsa ogsa anvendes, nar antallet af forventede observationer i en eller flere af cellerne er

mindre end 5.

METODE. Lad der være givet en 2×2-tabel:

a b

c d

med rækkesummer R1 = a + b og R2 = c + d og søjlesummer S1 = a + c og S2 = b + d

og samlet sum N = R1 + R2 = S1 + S2 = a + b + c + d. Vi tester uafhængighedshypotesen

H0 mod den alternative hypotese H1 , at “diagonalsandsynlighederne” p11 og p22 er større, end

hvis der havde været uafhængighed. (Dette kan altid opnas ved evt. at bytte om pa rækkerne). Den

betingede sandsynlighed for at fa netop ovenstaende 2×2-tabel givet at rækkesummerne er R1 ogR2, og søjlesummerne er S1 og S2, er

Pbetinget =R1! R2! S1! S2!N ! a! b! c! d!

.

Signifikanssandsynligheden i Fisher’s eksakte test er nu summen af Pbetinget taget pa alle 2×2-

tabeller med samme række- og søjlesummer som den givne, og som er ligesa ekstreme eller mere

ekstreme end den givne:

PFisher =min{b,c}∑

i=0

R1! R2! S1! S2!N ! (a + i)! (b− i)! (c− i)! (d + i)!

.

Page 73: Statistik - Gratis Kompendium - manan.dkmanan.dk/wp-content/uploads/2014/03/brink_david_statistik... · Statistisk testteori 7.1 Nulhypotese og alternativ hypotese 7.2 SigniÞ kanssandsynlighed

Download gratis bøger på ventus.dk / BookBooN.com

73

Lær Nemt! Statistik Kontingenstabeller

Uafhængighedshypotesen H0 forkastes, hvis PFisher er mindre en 5% (eller hvad man nu vælger

som signifikansniveau).

TILFØJELSE: Hvis man tester tosidet, altsa ikke mod en specifik alternativ hypotese, bliver sig-

nifikanssandsynligheden 2 · PFisher. Det forlanges dog samtidig, at 2×2-tabellen er skrevet sadan

op, at de observerede antal i diagonalen er større end de forventede antal (kan altid opnas ved at

bytte om pa rækkerne om nødvendigt).

20.6 Eksempel (Fisher’s eksakte test)

I et medicinsk forsøg med alternativ behandling medvirker 10 patienter, som inddeles tilfældigt i

2 grupper med 5 i hver. Patienterne i den ene gruppe behandles med akupunktur, mens patienterne

i den anden gruppe ingen behandling far. Ved forsøgets ophør konstateres, om hver patient er syg

eller rask. Resultatet kan opstilles i en 2× 2-tabel:

raske syge

akupunktur 4 1

ingen behandling 2 3

Signifikanssandsynligheden i Fisher’s eksakte test beregnes nu:

PFisher =1∑

i=0

5! 5! 6! 4!10! (4 + i)! (1− i)! (2− i)! (3 + i)!

= 26%

Med en sa stor signifikanssandsynlighed kan der ikke pavises nogen effekt af akupunkturbehand-

ling.

Zepto’s netbook. Nu også i fræk hvid højglans!

Zepto Znote V10b.Perfekt til studiet inkl. Windows XP, 12 måneders gratis Office pakke samt gratis taske

Kun 2.595,-Inkl. moms. Begrænset antal

eller find den på zepto.dk

Klik

rekl

amen

Page 74: Statistik - Gratis Kompendium - manan.dkmanan.dk/wp-content/uploads/2014/03/brink_david_statistik... · Statistisk testteori 7.1 Nulhypotese og alternativ hypotese 7.2 SigniÞ kanssandsynlighed

Download gratis bøger på ventus.dk / BookBooN.com

74

Lær Nemt! Statistik Fordelingsfri test

21 Fordelingsfri test

I alle de test, vi hidtil har set pa, har vi vidst noget om den fordeling, de givne observationer

stammede fra. Vi har fx vidst, at fordelingen var en normalfordeling, selvom vi ikke kendte mid-

delværdien eller spredningen.

I visse tilfælde kommer man imidlertid ud for, at man intet ved om den bagvedliggende for-

deling. Man ma da bruge en fordelingsfri test (ogsa kaldet ikke-parametrisk test).

21.1 Wilcoxons test for et sæt observationer

Lad der være givet n uafhængige observationer d1, . . . , dn fra en ukendt fordeling. Vi tester nul-

hypotesen

H0: Den ukendte fordeling er symmetrisk omkring 0.

Hver observation di tildeles et rangtal, som er et af tallene 1, 2, . . . , n. Denne tildeling sker

saledes, at observationen med den laveste numeriske værdi far rangtallet 1, observationen med

den næstlaveste numeriske værdi far rangtallet 2, osv. Definer nu teststørrelserne

t+ =∑

(rangtal svarende til positive di),

t− =∑

(rangtal svarende til negative di).

(Pa dette tidspunkt kan man checke, at der gælder t+ + t− = n(n + 1)/2; hvis ikke, har man

regnet galt). Hvis H0 holder, vil t+ og t− være cirka lige store. Hvornar H0 forkastes, afhænger

af, hvilken alternativ hypotese man tester mod.

Hvis man tester H0 mod den alternative hypotese

H1: Den ukendte fordeling giver overvejende positive observationer,

sa forkastes H0, hvis t− er ekstremt lille. Vælg et signifikansniveau α, og sla op i Tabel C.8 un-

der n og α. Hvis t− er mindre eller lig tabelværdien, sa forkaster man H0. Hvis t− er større end

tabelværdien, kan H0 ikke forkastes.

Hvis man tester H0 mod den alternative hypotese

H1: Den ukendte fordeling giver overvejende negative observationer,

sa forkastes H0, hvis t+ er ekstremt lille. Vælg et signifikansniveau α, og sla op i Tabel C.8 un-

der n og α. Hvis t+ er mindre eller lig tabelværdien, sa forkaster man H0. Hvis t+ er større end

tabelværdien, kan H0 ikke forkastes.

Hvis H0 ikke testes mod nogen særlig alternativ hypotese, forkastes nulhypotesen, hvis minimum

t := min{t+, t−} er ekstremt lille. Vælg et signifikansniveau α, og sla op i Tabel C.8 under n og

α/2 (hvis man fx vælger signifikansniveau α = 5%, skal man sla op i tabellen under n og 0, 025).

Page 75: Statistik - Gratis Kompendium - manan.dkmanan.dk/wp-content/uploads/2014/03/brink_david_statistik... · Statistisk testteori 7.1 Nulhypotese og alternativ hypotese 7.2 SigniÞ kanssandsynlighed

Download gratis bøger på ventus.dk / BookBooN.com

75

Lær Nemt! Statistik Fordelingsfri test

Hvis t er mindre eller lig tabelværdien, sa forkaster man H0. Hvis t er større end tabelværdien,

kan H0 ikke forkastes.

Ovenstaende test finder primært anvendelse, nar der foreligger to sæt af observationer x1, . . . , xn

og y1, . . . , yn, og di er differensen mellem “før-værdien” xi og “efter-værdien” yi, altsa di =xi− yi. Hvis der kun er tilfældige, usystematiske forskelle mellem før- og efter-værdierne, følger,

at di’erne er fordelt symmetrisk omkring 0

21.2 Eksempel

Et forsøg med 10 personer skal vise, om motion virker blodtrykssænkende. Ved forsøgets start

males de 10 forsøgspersoners blodtryk. Disse observationer kaldes x1, . . . x10. Efter en maneds

motion males blodtrykkene atter. Disse observationer kaldes y1, . . . y10. Vi vil nu teste nul-hypotesen

H0: Motion spiller ingen rolle for blodtrykket. De 10 differenser di = xi − yi vil derfor være for-delt symmetrisk omkring 0,

mod den alternative hypotese

H1: Motion virker blodtrykssænkende. De 10 differenser di vil derfor være overvejende positive.

Vi beregner rangtallene og t+ og t−:

Person 1 2 3 4 5 6 7 8 9 10

Førværdi xi 140 125 110 130 170 165 135 140 155 145

Efterværdi yi 137 137 102 104 172 125 140 110 140 126

Differens di 3 –12 8 26 –2 40 –5 30 15 19

Rangtal 2 5 4 8 1 10 3 9 6 7

t+ = 2 + 4 + 6 + 7 + 8 + 9 + 10 = 46,

t− = 1 + 3 + 5 = 9.

Vi forkaster altsa H0, hvis t− = 9 er ekstremt lille. Et opslag i Tabel C.8 med signifikansniveau

α = 5% viser, at “ekstremt lille” betyder � 10. Konklusion: testet viser, at nul-hypotesen H0 ikkekan opretholdes mod den alternative hypotese H1 pa signifikansniveau 5%.

21.3 Normalapproksimation til Wilcoxons test for et sæt observationer

Tabel C.8 gar op til n = 50. Hvis antallet af observationer er større, kan man benytte en normalfor-

delingsapproksimation. Der gælder nemlig under forudsætning af nul-hypotesen, at teststørrelsen

t+ er approksimativt normalfordelt med middelværdi

μ =n(n + 1)

4

og spredning

σ =

√n(n + 1)(2n + 1)

24.

Page 76: Statistik - Gratis Kompendium - manan.dkmanan.dk/wp-content/uploads/2014/03/brink_david_statistik... · Statistisk testteori 7.1 Nulhypotese og alternativ hypotese 7.2 SigniÞ kanssandsynlighed

Download gratis bøger på ventus.dk / BookBooN.com

76

Lær Nemt! Statistik Fordelingsfri test

Signifikanssandsynligheden findes derfor ved at sammenholde teststørrelsen

z =t+ − μ

σ

med Tabel C.2 over standardnormalfordelingen.

Eksempel. Lad os bruge normalapproksimationen til at finde signifikanssandsynligheden i forrige

eksempel (selvom n her er mindre end 50, og approksimationen derfor ikke bliver helt præcis). Vi

far μ = 27,5 og σ = 9,81. Teststørrelsen bliver derfor z = 1,89, hviket giver signifikanssandsyn-

ligheden 2,9%. Konklusionen er altsa den samme, nemlig at H0 forkastes pa signifikansniveau

5%.

21.4 Wilcoxons test for to sæt observationer

Lad der være givet to sæt x1, . . . , xn og y1, . . . ym af uafhængige observationer. Vi tester nul-

hypotesen

H0: Observationerne stammer fra samme fordeling.

Hver af de n + m observationer tildeles et rangtal, som er et af tallene 1, 2, . . . , n + m. Denne

tildeling sker saledes, at observationen med den laveste numeriske værdi far rangtallet 1, observa-

tionen med den næstlaveste numeriske værdi far rangtallet 2, osv. Definer teststørrelsen

tx =∑

(xi’ernes rangtal).

Om H0 forkastes, afhænger af, hvilken alternativ hypotese man tester mod.

Hvis man tester H0 mod den alternative hypotese

H1: xi’erne er overvejende mindre end yi’erne,

sa forkastes H0, hvis tx er ekstremt lille. Sla op i Tabel C.9 under n og m. Hvis tx er mindre

eller lig tabelværdien, sa forkaster man H0 pa signifikansniveau α = 5%. Hvis tx er større end

tabelværdien, kan H0 ikke forkastes pa signifikansniveau α = 5%.

Hvis man vil teste H0 mod den alternative hypotese

H1: xi’erne er overvejende større end yi’erne,

sa ma man bytte om pa xi’erne og yi’erne og gøre som ovenfor beskrevet.

Hvis H0 ikke testes mod nogen særlig alternativ hypotese, sa forkastes nulhypotesen, hvis mini-

mum

t := min{tx, n(n + m + 1)− tx}er ekstremt lille. Sla op i Tabel C.9 under n og m. Hvis t er mindre eller lig tabelværdien, sa

forkaster man H0 pa signifikansniveau α = 10%. Hvis t er større end tabelværdien, kan H0 ikke

forkastes pa signifikansniveau 10%.

Page 77: Statistik - Gratis Kompendium - manan.dkmanan.dk/wp-content/uploads/2014/03/brink_david_statistik... · Statistisk testteori 7.1 Nulhypotese og alternativ hypotese 7.2 SigniÞ kanssandsynlighed

Download gratis bøger på ventus.dk / BookBooN.com

77

Lær Nemt! Statistik Fordelingsfri test

21.5 Normalapproksimation til Wilcoxons test for to sæt observationer

Tabel C.9 kan benyttes for moderate værdier af n og m. Hvis antallet af observationer er større,

kan man benytte en normalfordelingsapproksimation. Der gælder nemlig under forudsætning af

nul-hypotesen, at teststørrelsen tx er approksimativt normalfordelt med middelværdi

μ =n(n + m + 1)

2

og spredning

σ =

√nm(n + m + 1)

12.

Signifikanssandsynligheden findes derfor ved at sammenholde teststørrelsen

z =tx − μ

σ

med Tabel C.2 over standardnormalfordelingen.

Interesserer du dig for penge- og valutapolitiske problemstillin-ger, har vi meget at byde på, fx bogen ”Pengepolitik i Danmark”. Du kan også læse vores Kvartalsoversigt eller Working Papers om makroøkonomiske emner. Hvis du kan forestille dig en dag selv at skrive artikler for Nationalbanken, kan du gå ind og se, hvad vi har at tilbyde af ledige jobs.

Se mere på www.nationalbanken.dk

Nationalbanken bidrager til: ♦ stabile priser – ved at indrette pengepolitikken efter en fast kronekurs over for euroen ♦ sikre betalinger – ved at udstede sedler og mønter og være bank for penge- og realkreditinstitutterne ♦ stabilitet i det finansielle system – ved at vurdere den finansielle stabilitet, overvåge betalingssystemer, produ-cere finansiel statistik og forvalte statens gæld. Som arbejdsplads kan vi tilbyde spændende arbejdsopgaver med et højt fagligt indhold. Vi bestræber os på at udvikle vores medarbejdere både fagligt og personligt.

Interesseret i makroøkonomi?

Danmarks Nationalbank

Klik

rekl

amen

Page 78: Statistik - Gratis Kompendium - manan.dkmanan.dk/wp-content/uploads/2014/03/brink_david_statistik... · Statistisk testteori 7.1 Nulhypotese og alternativ hypotese 7.2 SigniÞ kanssandsynlighed

Download gratis bøger på ventus.dk / BookBooN.com

78

Lær Nemt! Statistik Lineær regression

22 Lineær regression

22.1 Modellen

Lad der være givet en stikprøve bestaende af n observationspar

(x1, y1) , (x2, y2) . . . , (xn, yn) .

Vi opstiller den model, at hvert yi er en observation fra en stokastisk variabel

Yi = β0 + β1xi + Ei

hvor Ei’erne er uafhængige normalfordelte stokastiske variable med middelværdi 0 og fælles

varians σ2. Vi kan altsa skrive hvert yi som

yi = β0 + β1xi + ei

hvor ei er en observation fra Ei. Man kalder yi responsvariablen, xi den forklarende variabelog ei restleddet.

22.2 Estimering af parametrene β0 og β1

Lad x være gennemsnittet af xi’erne og y gennemsnittet af yi’erne. Definer summen af afvigel-sernes produkter

SAPxy =n∑

i=1

(xi − x)(yi − y)

samt summen af afvigelsernes kvadrater

SAKx =n∑

i=1

(xi − x)2

Parametrene β0 og β1 i regressionsligningen estimeres da som⎧⎨⎩β1 =SAPxy

SAKx

β0 = y − β1x

22.3 Estimatorernes fordeling

Hvis modellens forudsætningerne er opfyldt, er estimatoren β0 normalfordelt med middelværdi

β0 (estimatoren er altsa middelret) og varians σ2(1/n + x2/SAKx). Der gælder med andre ord

β0 ∼ N

(β0, σ

2

(1n

+x2

SAKx

)).

Endvidere er estimatoren β1 normalfordelt med middelværdi β1 (denne estimator er altsa ogsa

middelret) og varians σ2/SAKx. Der gælder med andre ord

β1 ∼ N

(β1,

σ2

SAKx

).

Page 79: Statistik - Gratis Kompendium - manan.dkmanan.dk/wp-content/uploads/2014/03/brink_david_statistik... · Statistisk testteori 7.1 Nulhypotese og alternativ hypotese 7.2 SigniÞ kanssandsynlighed

Download gratis bøger på ventus.dk / BookBooN.com

79

Lær Nemt! Statistik Lineær regression

22.4 Forudsagte værdier yi og residualer ei

Ud fra estimaterne β0 og β1 kan for hvert i den forudsagte værdi af yi beregnes som

yi = β0 + β1xi .

Det i’te residual ei er forskellen mellem den faktiske værdi yi og den forudsagte værdi yi:

ei = yi − yi .

Residualet ei er et estimat for restleddet ei.

22.5 Estimering af variansen σ2

Man indfører summen af residualernes kavdrater

SRK =n∑

i=1

e2i .

Restleddenes varians σ2 estimeres nu som

s2 =SRK

n− 2.

Denne estimator er middelret (men ikke lig ML-estimatoren).

22.6 Konfidensinterval for parametrene β0 og β1

Nar man har estimeret parametrene β0 og β1, kan man beregne konfidensintervallet med konfi-

densgrad 1− α omkring estimaterne β0 og β1. Disse er⎧⎪⎪⎨⎪⎪⎩β0 ± t1−α/2s

√1n

+x2

SAKx

β1 ± t1−α/2s√

SAKx

Tallet t1−α/2 er fastlagt ved F (u1−α/2) = 1− α/2, hvor F er fordelingsfunktionen for Student’s

t-fordeling med n− 1 frihedsgrader, se ogsa afsnit 15.8.

22.7 Determinationskoefficienten R2

For at undersøge, hvor godt modellen med de estimerede parametre kan beskrive de faktiske

observationer, beregnes determinationskoefficienten

R2 =SAKy − SRK

SAKy

R2 ligger i intervallet [0, 1] og angiver den andel af yi’ernes variation, der af modellen beskrives

som en lineær funktion af xi’erne.

Huskeregel. Jo større determinationskoefficienten R2 er, des bedre beskriver modellen

observationerne.

Page 80: Statistik - Gratis Kompendium - manan.dkmanan.dk/wp-content/uploads/2014/03/brink_david_statistik... · Statistisk testteori 7.1 Nulhypotese og alternativ hypotese 7.2 SigniÞ kanssandsynlighed

Download gratis bøger på ventus.dk / BookBooN.com

80

Lær Nemt! Statistik Lineær regression

22.8 Forudsigelser og prediktionsinterval

Lad der være givet et reelt tal x0. Funktionsværdien

y0 = β0 + β1x0

estimeres eller forudsiges da som

y0 = β0 + β1x0 .

Konfidensintervallet eller prediktionsintervallet med konfidensgrad 1− α omkring estimatet y0

er da

y0 ± t1−α/2s

√1 +

1n

+(x0 − x)2

SAKx.

Tallet t1−α/2 er fastlagt ved F (u1−α/2) = 1− α/2, hvor F er fordelingsfunktionen for Student’s

t-fordeling med n− 2 frihedsgrader, se ogsa afsnit 15.8.

ARE YOU A FUTURE FIFTEEN?

We welcome talented, ambi�ous and global-minded young career-seekers to join our unique Future Fi�een graduate programme. Seize the F15® challenge and start your global Arla Foods career within a wide range of func�onal and geographical areas. We expect you to provide effort and determina�on. In return we give you the ideal framework for your professional and personal development. The applica�on window is open from 15 February to 15 March 2010. Keep yourself updated on www.futurefi�een.com

ARLA FOODS FUTURE FIFTEEN GRADUATE PROGRAMME

Klik

rekl

amen

Page 81: Statistik - Gratis Kompendium - manan.dkmanan.dk/wp-content/uploads/2014/03/brink_david_statistik... · Statistisk testteori 7.1 Nulhypotese og alternativ hypotese 7.2 SigniÞ kanssandsynlighed

Download gratis bøger på ventus.dk / BookBooN.com

81

Lær Nemt! Statistik Lineær regression

22.9 Oversigt over formler

Sx =∑n

i=1 xi Summen af xi’erne

x = Sx/n Gennemsnittet af xi’erne

SKx =∑n

i=1 x2i Summen af kvadraterne af xi’erne

SAKx =∑n

i=1(xi − x)2 = SKx − S2x/n Summen af afvigelsernes kvadrater

s2x = SAKx/(n− 1) empirisk varians af xi’erne

SPxy =∑n

i=1 xiyi Summen af produkterne

SAPxy =∑n

i=1(xi − x)(yi − y) = SPxy − SxSy/n Summen af afvigelsernes produkter

β1 = SAPxy/SAKx Estimatet pa β1

β0 = y − β1x Estimatet pa β0

yi = be0 + β1xi Forudsagt værdi af yi

ei = yi − yi Det i’te residual

SRK =∑n

i=1 e2i = SAKy − SAP 2

xy/SAKx Summen af residualernes kvadrater

s2 = SRK/(n− 2) Estimatet pa σ2

R2 = 1− SRK/SAKy Determinationskoefficienten

22.10 Eksempel

OPGAVE. Det hævdes, at temperaturen i Andesbjergene falder med 6 grader pr. 1000 meter. Ved

en samtidig maling pa 10 forskellige lokaliteter inden for et afgrænset omrade fandtes følgende

temperaturer:

Højde xi Temperatur yi

(meter) (grader)

500 15

1000 14

1500 11

2000 6

2500 –1

3000 2

3500 0

4000 –4

4500 –8

5000 –14

Vi antager en lineær regressionsmodel

yi = β0 + β1xi + ei

hvor restleddene ei er uafhængige normalfordelte med middelværdi 0 og samme varians σ2.

1) Estimer parametrene β0 og β1.

2) Bestem konfidensintervallet med konfidengrad 95% for β1.

3) Kan hypotesen H0 : β1 = −0,006 opretholdes?

4) Hvor stor en del af temperaturforskellene kan forklares som en lineær funktion af højden?

Page 82: Statistik - Gratis Kompendium - manan.dkmanan.dk/wp-content/uploads/2014/03/brink_david_statistik... · Statistisk testteori 7.1 Nulhypotese og alternativ hypotese 7.2 SigniÞ kanssandsynlighed

Download gratis bøger på ventus.dk / BookBooN.com

82

Lær Nemt! Statistik Lineær regression

SVAR. Vi foretager først de relevante beregninger:

Sx =∑10

i=1 xi = 27500 Sy =∑10

i=1 yi = 21x = Sx/10 = 2750 y = Sy/10 = 2,1SKx =

∑10i=1 x2

i = 96250000 SKy =∑10

i=1 y2i = 859

SAKx = SKx − S2x/10 = 20625000 SAKy = SKy − S2

y/10 = 814,9SPxy =

∑10i=1 xiyi = −68500 SAPxy = SPxy − SxSy/10 = −126250

β1 = SAPxy/SAKx = −0,0061 β0 = y − β1x = 18,9SRK = SAKy − SAP 2

xy/SAKx = 42,1 s2 = SRK/8 = 5,26R2 = 1− SRK/SAKy = 0,948

1) Det aflæses direkte af beregningerne, at estimaterne pa β0 og β1 er

β0 = 18,9 , β1 = −0,0061 .

2) Tallet t0,975 findes i Tabel C.4 under df = 10 − 1 = 9 frihedsgrader at være t0,975 = 2,31 (se

ogsa afsnit 15.8). Konfidensintervallet omkring β1 bliver dermed[−0,0061− 2,31

√5,26√

20625000, −0,0061 + 2,31

√5,26√

20625000

]= [−0,0073 , −0,0049] .

3) Hypotesen H0 : β1 = −0,006 opretholdes, da denne værdi ligger i konfidensintervallet.

4) Den del af temperaturforskellene, som kan beskrives ved hjælp af en lineær funktion af højden,

er netop determinationskoefficienten

R2 = 94,8%

At R2 er høj, viser, at de faktiske temperaturer ligger ganske tæt pa de forudsagte. Dette fremgar

ogsa af nedenstaende figur, som viser, at de faktiske temperaturer kun afviger lidt fra regressions-

linjen:

Page 83: Statistik - Gratis Kompendium - manan.dkmanan.dk/wp-content/uploads/2014/03/brink_david_statistik... · Statistisk testteori 7.1 Nulhypotese og alternativ hypotese 7.2 SigniÞ kanssandsynlighed

Download gratis bøger på ventus.dk / BookBooN.com

83

Lær Nemt! Statistik Engelsk-dansk ordliste

A Engelsk-dansk ordliste

Alternative hypothesis Alternativ hypotese

Analysis of variance (ANOVA) Variansanalyse (ANOVA)

Arithmetic mean Aritmetisk gennemsnit

Biased estimator Skæv (modsat middelret) estimator

Binomial coefficient Binomialkoefficient

Binomial distribution Binomialfordeling

Central limit theorem Den centrale grænseværdisætning

Centralised sum Centraliseret sum

Chi-square distribution Chi-kvadrat-fordeling, χ2-fordeling

Chi-square test Chi-kvadrat-test, χ2-test

Conditional probability Betinget sandsynlighed

Confidence interval Konfidensinterval

Contingency table Kontingenstabel

Continuity, correction for Korrektion for kontinuitet

Correction for continuity Korrektion for kontinuitet

Correlation Korrelation

Correlation coefficient Korrelationskoefficient

Covariance Covarians

Critical value Kritisk værdi

Vi har nogle gode tilbud, der kan hjælpe dig i dit arbejde med at finde drømmejobbet, den rigtige uddannelse eller en spændende karrierevej.

Ring eller skriv til Susanne Skov på 3266 1455 [email protected] og reservér tid til en samtale med en af vores konsulenter.

WWW.FINANSJOB.DK – DIT JOB OG KARRIERECENTER

SIDDER DU I DRØMMEJOBBET…ELLER?

Klik

rekl

amen

Page 84: Statistik - Gratis Kompendium - manan.dkmanan.dk/wp-content/uploads/2014/03/brink_david_statistik... · Statistisk testteori 7.1 Nulhypotese og alternativ hypotese 7.2 SigniÞ kanssandsynlighed

Download gratis bøger på ventus.dk / BookBooN.com

84

Lær Nemt! Statistik Engelsk-dansk ordliste

Cumulative probability Kumuleret sandsynlighed

Degrees of freedom Frihedsgrader

Density Tæthed

Density function Tæthedsfunktion

Density, marginal Marginal tæthed

Density, simultaneous Simultan tæthed

Disjoint Disjunkte (fx hændelser)

Discrete (distribution) Diskret (fordeling)

Distribution Fordeling

Distribution function Fordelingsfunktion

Empirical (variance) Empirisk (varians)

Error (of type I or II) Fejl (af type I eller II)

Estimate Estimat

Estimation Estimering

Event Hændelse

Expectation value Middelværdi

Expected number/frequency Forventet antal

Exponential distribution Eksponentialfordeling

F-distribution F-fordeling

F-test F-test

Freedom, degrees of Frihedsgrader

Geometric distribution Geometrisk fordeling

Goodness of fit Fordelingslighed

Grand mean Samlet gennemsnit

Hypothesis Hypotese

Independent (events, stoch. var.s) Uafhængige (hændelser, stok. var.)

Inter block variance Varians mellem stikprøverne

Intra block variance Varians inden for stikprøverne

Inter quartile range Afstand mellem 1. og 3. kvartil

Intersection Fællesmængde

Law of large numbers Store tals lov

Least squares method Mindste kvadraters metode

Level of significance Signifikansniveau

Likelihood (function) Likelihood (-funktion)

Linear regresssion Lineær regression

Map Afbildning, funktion

Marginal (density, distribution) Marginal (tæthed, fordeling)

Maximum likelihood estimator Maksimum likelihood-estimator (ML-estimator)

Mean Gennemsnit

Mean square Gennemsnitlig kvadratafvigelse∑

(xi − x)2/n

Median Median

ML-estimator Maksimum likelihood-estimator (ML-estimator)

Moments Momenter

Page 85: Statistik - Gratis Kompendium - manan.dkmanan.dk/wp-content/uploads/2014/03/brink_david_statistik... · Statistisk testteori 7.1 Nulhypotese og alternativ hypotese 7.2 SigniÞ kanssandsynlighed

Download gratis bøger på ventus.dk / BookBooN.com

85

Lær Nemt! Statistik Engelsk-dansk ordliste

Multinomial distribution Multinomialfordeling

Multiple regression Multipel (lineær) regression

Non-parametric test Ikke-parametrisk test

Normal distribution Normalfordeling

Normed normal distribution Standardnormalfordeling

Normed sum Normeret sum

Null hypothesis Nulhypotese

Observed number/frequency Observeret antal

One-sided test Ensidet test

Outlier Outlier (ekstrem observation)

Point estimation Punktestimering

Poisson distribution Poisson fordeling

Pooled variance “Pooled “ varians

Probability Sandsynlighed

Probability function Sandsynlighedsfunktion

Probability space Sandsynlighedsfelt

Quartile Kvartil

Random variable Stokastisk variable

Rank Rang, rangtal

Rank sum Sum af rangtal

Reject Forkaste

Root mean square Kvadratroden af den gennemsnitlige kvadratafvigelse

Sample Stikprøve; udfald

Sample correlation coefficient Empirisk korrelationskoefficient

Sample mean Gennemsnit

Sample size Stikprøvestørrelse

Sample space Udfaldsrum

Sample variance Empirisk varians

Sampling distribution Fordeling af teststørrelse

Set Mængde

Significance level Signifikansniveau

Slope Hældning, hældningskoefficient

Standard deviation Spredning

Statistic Teststørrelse

Stochastic variable stokastisk variabel

Student’s t Student’s t (test, fordeling)

Tail probability (left/right) Halesandsynlighed (højre/venstre)

Test Test

Two-sided test Tosidet test

Type I or II error Fejl af type I eller II

Unbiased estimator Middelret (modsat skæv) estimator

Uniform distribution Ligefordeling

Union Foreningsmængde

Variance Varians

Page 86: Statistik - Gratis Kompendium - manan.dkmanan.dk/wp-content/uploads/2014/03/brink_david_statistik... · Statistisk testteori 7.1 Nulhypotese og alternativ hypotese 7.2 SigniÞ kanssandsynlighed

Download gratis bøger på ventus.dk / BookBooN.com

86

Lær Nemt! Statistik Oversigt over diskrete fordelinger

B Oversigt over diskrete fordelinger

Fordeling Beskrivelse Værdier Punktsand-

synligheder

Middel-

værdiVarians

Binomial-

fordelingen

Bin(n, p)

Antal succe-

ser i n forsøg

k = 0, 1, . . . , n

(n

k

)pkqn−k np npq

Poisson-

fordelingen

Pois(λ)

Antal spon-

tane begi-

venheder i et

tidsinterval

k = 0, 1, . . .λk

k!e−λ λ λ

Den geome-

triske forde-

ling Geo(p)

Antal fiasko-

er før succes

k = 0, 1, . . . qkp q/p q/p2

Den hyper-

geometriske

fordeling

HG(n, r,N)

Antal røde

kugler

blandt n

udtrukne

k = 0, . . .

. . . , min{n, r}

(rk

)(s

n−k

)(Nn

) nr/Nnrs(N − n)N2(N − 1)

Den negative

binomial-

fordeling

NB(n, p)

Antal fiasko-

er før n’te

succes

k = 0, 1 . . .

(n + k − 1

n− 1

)· pn · qk nq/p nq/p2

Multi-

nomial-

fordelingen

Mult(n, p1, . . . , pr)

Antal udfald

af hver type

(k1, . . . , kr)hvor∑

ki = n

(n

k1 · · · kr

)·∏ pki

i — —

Page 87: Statistik - Gratis Kompendium - manan.dkmanan.dk/wp-content/uploads/2014/03/brink_david_statistik... · Statistisk testteori 7.1 Nulhypotese og alternativ hypotese 7.2 SigniÞ kanssandsynlighed

Download gratis bøger på ventus.dk / BookBooN.com

87

Lær Nemt! Statistik Tabeller

C Tabeller

C.1 Sadan forstas tabellerne

Tabel C.2 angiver værdier af fordelingsfunktionen

Φ(u) =∫ u

−∞1√2π

exp(−1

2t2)

dt

for standardnormalfordelingen.

Tabel C.3 angiver værdier af x, for hvilke fordelingsfunktionen F = Fχ2 for χ2-fordelingen med

df frihedsgrader tager værdierne F (x) = 0,500, F (x) = 0,600 etc.

Tabel C.4 angiver værdier af x, for hvilke fordelingsfunktionen F = FStudent for Student’s t-

fordeling med df frihedsgrader tager værdierne F (x) = 0,600, F (x) = 0,700 etc.

Tabel C.5, Tabel C.6 og Tabel C.7 angiver værdier af x, for hvilke fordelingsfunktionen F =FFisher for Fisher’s F -fordeling med n frihedsgrader i tælleren (øverste linje) og m frihedsgrader

i nævneren (venstre søjle) tager værdien F (x) = 0,90 hhv. F (x) = 0,95 hhv. F (x) = 0,99.

Tabel C.8 og Tabel C.9 angiver kritiske værdier for Wilcoxons test for et og to sæt observationer.

Se Kapitel 21 for nærmere detaljer.

MAKING MODERN LIVING POSSIBLE

READY TO GET ONBOARD?Danfoss Postgraduate Programme – Finance

DANFOSS HUMAN RESOURCES

Get onboard and send you application via pgp.danfoss.comApplication deadline: 1st of May 2010

Klik

rekl

amen

Page 88: Statistik - Gratis Kompendium - manan.dkmanan.dk/wp-content/uploads/2014/03/brink_david_statistik... · Statistisk testteori 7.1 Nulhypotese og alternativ hypotese 7.2 SigniÞ kanssandsynlighed

Download gratis bøger på ventus.dk / BookBooN.com

88

Lær Nemt! Statistik Tabeller

C.2 Standardnormalfordelingen

u Φ(u) Φ(−u)0,00 0,5000 0,50000,01 0,5040 0,49600,02 0,5080 0,49200,03 0,5120 0,48800,04 0,5160 0,48400,05 0,5199 0,48010,06 0,5239 0,47610,07 0,5279 0,47210,08 0,5319 0,46810,09 0,5359 0,46410,10 0,5398 0,46020,11 0,5438 0,45620,12 0,5478 0,45220,13 0,5517 0,44830,14 0,5557 0,44430,15 0,5596 0,44040,16 0,5636 0,43640,17 0,5675 0,43250,18 0,5714 0,42860,19 0,5753 0,42470,20 0,5793 0,42070,21 0,5832 0,41680,22 0,5871 0,41290,23 0,5910 0,40900,24 0,5948 0,40520,25 0,5987 0,40130,26 0,6026 0,39740,27 0,6064 0,39360,28 0,6103 0,38970,29 0,6141 0,38590,30 0,6179 0,38210,31 0,6217 0,37830,32 0,6255 0,37450,33 0,6293 0,37070,34 0,6331 0,36690,35 0,6368 0,3632

u Φ(u) Φ(−u)0,36 0,6406 0,35940,37 0,6443 0,35570,38 0,6480 0,35200,39 0,6517 0,34830,40 0,6554 0,34460,41 0,6591 0,34090,42 0,6628 0,33720,43 0,6664 0,33360,44 0,6700 0,33000,45 0,6736 0,32640,46 0,6772 0,32280,47 0,6808 0,31920,48 0,6844 0,31560,49 0,6879 0,31210,50 0,6915 0,30850,51 0,6950 0,30500,52 0,6985 0,30150,53 0,7019 0,29810,54 0,7054 0,29460,55 0,7088 0,29120,56 0,7123 0,28770,57 0,7157 0,28430,58 0,7190 0,28100,59 0,7224 0,27760,60 0,7257 0,27430,61 0,7291 0,27090,62 0,7324 0,26760,63 0,7357 0,26430,64 0,7389 0,26110,65 0,7422 0,25780,66 0,7454 0,25460,67 0,7486 0,25140,68 0,7517 0,24830,69 0,7549 0,24510,70 0,7580 0,24200,71 0,7611 0,2389

u Φ(u) Φ(−u)0,72 0,7642 0,23580,73 0,7673 0,23270,74 0,7704 0,22960,75 0,7734 0,22660,76 0,7764 0,22360,77 0,7794 0,22060,78 0,7823 0,21770,79 0,7852 0,21480,80 0,7881 0,21190,81 0,7910 0,20900,82 0,7939 0,20610,83 0,7967 0,20330,84 0,7995 0,20050,85 0,8023 0,19770,86 0,8051 0,19490,87 0,8078 0,19220,88 0,8106 0,18940,89 0,8133 0,18670,90 0,8159 0,18410,91 0,8186 0,18140,92 0,8212 0,17880,93 0,8238 0,17620,94 0,8264 0,17360,95 0,8289 0,17110,96 0,8315 0,16850,97 0,8340 0,16600,98 0,8365 0,16350,99 0,8389 0,16111,00 0,8413 0,15871,01 0,8438 0,15621,02 0,8461 0,15391,03 0,8485 0,15151,04 0,8508 0,14921,05 0,8531 0,14691,06 0,8554 0,14461,07 0,8577 0,1423

Page 89: Statistik - Gratis Kompendium - manan.dkmanan.dk/wp-content/uploads/2014/03/brink_david_statistik... · Statistisk testteori 7.1 Nulhypotese og alternativ hypotese 7.2 SigniÞ kanssandsynlighed

Download gratis bøger på ventus.dk / BookBooN.com

89

Lær Nemt! Statistik Tabeller

u Φ(u) Φ(−u)1,08 0,8599 0,14011,09 0,8621 0,13791,10 0,8643 0,13571,11 0,8665 0,13351,12 0,8686 0,13141,13 0,8708 0,12921,14 0,8729 0,12711,15 0,8749 0,12511,16 0,8770 0,12301,17 0,8790 0,12101,18 0,8810 0,11901,19 0,8830 0,11701,20 0,8849 0,11511,21 0,8869 0,11311,22 0,8888 0,11121,23 0,8907 0,10931,24 0,8925 0,10751,25 0,8944 0,10561,26 0,8962 0,10381,27 0,8980 0,10201,28 0,8997 0,10031,29 0,9015 0,09851,30 0,9032 0,09681,31 0,9049 0,09511,32 0,9066 0,09341,33 0,9082 0,09181,34 0,9099 0,09011,35 0,9115 0,08851,36 0,9131 0,08691,37 0,9147 0,08531,38 0,9162 0,08381,39 0,9177 0,08231,40 0,9192 0,08081,41 0,9207 0,07931,42 0,9222 0,07781,43 0,9236 0,07641,44 0,9251 0,0749

u Φ(u) Φ(−u)1,45 0,9265 0,07351,46 0,9279 0,07211,47 0,9292 0,07081,48 0,9306 0,06941,49 0,9319 0,06811,50 0,9332 0,06681,51 0,9345 0,06551,52 0,9357 0,06431,53 0,9370 0,06301,54 0,9382 0,06181,55 0,9394 0,06061,56 0,9406 0,05941,57 0,9418 0,05821,58 0,9429 0,05711,59 0,9441 0,05591,60 0,9452 0,05481,61 0,9463 0,05371,62 0,9474 0,05261,63 0,9484 0,05161,64 0,9495 0,05051,65 0,9505 0,04951,66 0,9515 0,04851,67 0,9525 0,04751,68 0,9535 0,04651,69 0,9545 0,04551,70 0,9554 0,04461,71 0,9564 0,04361,72 0,9573 0,04271,73 0,9582 0,04181,74 0,9591 0,04091,75 0,9599 0,04011,76 0,9608 0,03921,77 0,9616 0,03841,78 0,9625 0,03751,79 0,9633 0,03671,80 0,9641 0,03591,81 0,9649 0,0351

u Φ(u) Φ(−u)1,82 0,9656 0,03441,83 0,9664 0,03361,84 0,9671 0,03291,85 0,9678 0,03221,86 0,9686 0,03141,87 0,9693 0,03071,88 0,9699 0,03011,89 0,9706 0,02941,90 0,9713 0,02871,91 0,9719 0,02811,92 0,9726 0,02741,93 0,9732 0,02681,94 0,9738 0,02621,95 0,9744 0,02561,96 0,9750 0,02501,97 0,9756 0,02441,98 0,9761 0,02391,99 0,9767 0,02332,00 0,9772 0,02282,01 0,9778 0,02222,02 0,9783 0,02172,03 0,9788 0,02122,04 0,9793 0,02072,05 0,9798 0,02022,06 0,9803 0,01972,07 0,9808 0,01922,08 0,9812 0,01882,09 0,9817 0,01832,10 0,9821 0,01792,11 0,9826 0,01742,12 0,9830 0,01702,13 0,9834 0,01662,14 0,9838 0,01622,15 0,9842 0,01582,16 0,9846 0,01542,17 0,9850 0,01502,18 0,9854 0,0146

Page 90: Statistik - Gratis Kompendium - manan.dkmanan.dk/wp-content/uploads/2014/03/brink_david_statistik... · Statistisk testteori 7.1 Nulhypotese og alternativ hypotese 7.2 SigniÞ kanssandsynlighed

Download gratis bøger på ventus.dk / BookBooN.com

90

Lær Nemt! Statistik Tabeller

u Φ(u) Φ(−u)2,19 0,9857 0,01432,20 0,9861 0,01392,21 0,9864 0,01362,22 0,9868 0,01322,23 0,9871 0,01292,24 0,9875 0,01252,25 0,9878 0,01222,26 0,9881 0,01192,27 0,9884 0,01162,28 0,9887 0,01132,29 0,9890 0,01102,30 0,9893 0,01072,31 0,9896 0,01042,32 0,9898 0,01022,33 0,9901 0,00992,34 0,9904 0,00962,35 0,9906 0,00942,36 0,9909 0,00912,37 0,9911 0,00892,38 0,9913 0,00872,39 0,9916 0,00842,40 0,9918 0,00822,41 0,9920 0,00802,42 0,9922 0,00782,43 0,9925 0,00752,44 0,9927 0,00732,45 0,9929 0,00712,46 0,9931 0,00692,47 0,9932 0,00682,48 0,9934 0,00662,49 0,9936 0,00642,50 0,9938 0,00622,51 0,9940 0,00602,52 0,9941 0,00592,53 0,9943 0,00572,54 0,9945 0,00552,55 0,9946 0,0054

u Φ(u) Φ(−u)2,56 0,9948 0,00522,57 0,9949 0,00512,58 0,9951 0,00492,59 0,9952 0,00482,60 0,9953 0,00472,61 0,9955 0,00452,62 0,9956 0,00442,63 0,9957 0,00432,64 0,9959 0,00412,65 0,9960 0,00402,66 0,9961 0,00392,67 0,9962 0,00382,68 0,9963 0,00372,69 0,9964 0,00362,70 0,9965 0,00352,71 0,9966 0,00342,72 0,9967 0,00332,73 0,9968 0,00322,74 0,9969 0,00312,75 0,9970 0,00302,76 0,9971 0,00292,77 0,9972 0,00282,78 0,9973 0,00272,79 0,9974 0,00262,80 0,9974 0,00262,81 0,9975 0,00252,82 0,9976 0,00242,83 0,9977 0,00232,84 0,9977 0,00232,85 0,9978 0,00222,86 0,9979 0,00212,87 0,9979 0,00212,88 0,9980 0,00202,89 0,9981 0,00192,90 0,9981 0,00192,91 0,9982 0,00182,92 0,9982 0,0018

u Φ(u) Φ(−u)2,93 0,9983 0,00172,94 0,9984 0,00162,95 0,9984 0,00162,96 0,9985 0,00152,97 0,9985 0,00152,98 0,9986 0,00142,99 0,9986 0,00143,00 0,9987 0,00133,10 0,9990 0,00103,20 0,9993 0,00073,30 0,9995 0,00053,40 0,9997 0,00033,50 0,9998 0,00023,60 0,9998 0,00023,70 0,9999 0,00013,80 0,9999 0,00013,90 1,0000 0,00004,00 1,0000 0,0000

Page 91: Statistik - Gratis Kompendium - manan.dkmanan.dk/wp-content/uploads/2014/03/brink_david_statistik... · Statistisk testteori 7.1 Nulhypotese og alternativ hypotese 7.2 SigniÞ kanssandsynlighed

Download gratis bøger på ventus.dk / BookBooN.com

91

Lær Nemt! Statistik Tabeller

C.3 χ2-fordelingen (værdier x med Fχ2(x) = 0,500 etc.)

df 0,500 0,600 0,700 0,800 0,900 0,950 0,975 0,990 0,995 0,999

1 0,45 0,71 1,07 1,64 2,71 3,84 5,02 6,63 7,88 10,83

2 1,39 1,83 2,41 3,22 4,61 5,99 7,38 9,21 10,60 13,82

3 2,37 2,95 3,66 4,64 6,25 7,81 9,35 11,34 12,84 16,27

4 3,36 4,04 4,88 5,99 7,78 9,49 11,14 13,28 14,86 18,47

5 4,35 5,13 6,06 7,29 9,24 11,07 12,83 15,09 16,75 20,52

6 5,35 6,21 7,23 8,56 10,64 12,59 14,45 16,81 18,55 22,46

7 6,35 7,28 8,38 9,80 12,02 14,07 16,01 18,48 20,28 24,32

8 7,34 8,35 9,52 11,03 13,36 15,51 17,53 20,09 21,95 26,12

9 8,34 9,41 10,66 12,24 14,68 16,92 19,02 21,67 23,59 27,88

10 9,34 10,47 11,78 13,44 15,99 18,31 20,48 23,21 25,19 29,59

11 10,34 11,53 12,90 14,63 17,28 19,68 21,92 24,72 26,76 31,26

12 11,34 12,58 14,01 15,81 18,55 21,03 23,34 26,22 28,30 32,91

13 12,34 13,64 15,12 16,98 19,81 22,36 24,74 27,69 29,82 34,53

14 13,34 14,69 16,22 18,15 21,06 23,68 26,12 29,14 31,32 36,12

15 14,34 15,73 17,32 19,31 22,31 25,00 27,49 30,58 32,80 37,70

16 15,34 16,78 18,42 20,47 23,54 26,30 28,85 32,00 34,27 39,25

17 16,34 17,82 19,51 21,61 24,77 27,59 30,19 33,41 35,72 40,79

18 17,34 18,87 20,60 22,76 25,99 28,87 31,53 34,81 37,16 42,31

19 18,34 19,91 21,69 23,90 27,20 30,14 32,85 36,19 38,58 43,82

20 19,34 20,95 22,77 25,04 28,41 31,41 34,17 37,57 40,00 45,31

21 20,34 21,99 23,86 26,17 29,62 32,67 35,48 38,93 41,40 46,80

22 21,34 23,03 24,94 27,30 30,81 33,92 36,78 40,29 42,80 48,27

23 22,34 24,07 26,02 28,43 32,01 35,17 38,08 41,64 44,18 49,73

24 23,34 25,11 27,10 29,55 33,20 36,42 39,36 42,98 45,56 51,18

25 24,34 26,14 28,17 30,68 34,38 37,65 40,65 44,31 46,93 52,62

26 25,34 27,18 29,25 31,79 35,56 38,89 41,92 45,64 48,29 54,05

27 26,34 28,21 30,32 32,91 36,74 40,11 43,19 46,96 49,64 55,48

28 27,34 29,25 31,39 34,03 37,92 41,34 44,46 48,28 50,99 56,89

29 28,34 30,28 32,46 35,14 39,09 42,56 45,72 49,59 52,34 58,30

30 29,34 31,32 33,53 36,25 40,26 43,77 46,98 50,89 53,67 59,70

31 30,34 32,35 34,60 37,36 41,42 44,99 48,23 52,19 55,00 61,10

32 31,34 33,38 35,66 38,47 42,58 46,19 49,48 53,49 56,33 62,49

33 32,34 34,41 36,73 39,57 43,75 47,40 50,73 54,78 57,65 63,87

34 33,34 35,44 37,80 40,68 44,90 48,60 51,97 56,06 58,96 65,25

35 34,34 36,47 38,86 41,78 46,06 49,80 53,20 57,34 60,27 66,62

Page 92: Statistik - Gratis Kompendium - manan.dkmanan.dk/wp-content/uploads/2014/03/brink_david_statistik... · Statistisk testteori 7.1 Nulhypotese og alternativ hypotese 7.2 SigniÞ kanssandsynlighed

Download gratis bøger på ventus.dk / BookBooN.com

92

Lær Nemt! Statistik Tabeller

df 0,500 0,600 0,700 0,800 0,900 0,950 0,975 0,990 0,995 0,999

36 35,34 37,50 39,92 42,88 47,21 51,00 54,44 58,62 61,58 67,99

37 36,34 38,53 40,98 43,98 48,36 52,19 55,67 59,89 62,88 69,35

38 37,34 39,56 42,05 45,08 49,51 53,38 56,90 61,16 64,18 70,70

39 38,34 40,59 43,11 46,17 50,66 54,57 58,12 62,43 65,48 72,05

40 39,34 41,62 44,16 47,27 51,81 55,76 59,34 63,69 66,77 73,40

41 40,34 42,65 45,22 48,36 52,95 56,94 60,56 64,95 68,05 74,74

42 41,34 43,68 46,28 49,46 54,09 58,12 61,78 66,21 69,34 76,08

43 42,34 44,71 47,34 50,55 55,23 59,30 62,99 67,46 70,62 77,42

44 43,34 45,73 48,40 51,64 56,37 60,48 64,20 68,71 71,89 78,75

45 44,34 46,76 49,45 52,73 57,51 61,66 65,41 69,96 73,17 80,08

46 45,34 47,79 50,51 53,82 58,64 62,83 66,62 71,20 74,44 81,40

47 46,34 48,81 51,56 54,91 59,77 64,00 67,82 72,44 75,70 82,72

48 47,34 49,84 52,62 55,99 60,91 65,17 69,02 73,68 76,97 84,04

49 48,33 50,87 53,67 57,08 62,04 66,34 70,22 74,92 78,23 85,35

50 49,33 51,89 54,72 58,16 63,17 67,50 71,42 76,15 79,49 86,66

51 50,33 52,92 55,78 59,25 64,30 68,67 72,62 77,39 80,75 87,97

52 51,33 53,94 56,83 60,33 65,42 69,83 73,81 78,62 82,00 89,27

53 52,33 54,97 57,88 61,41 66,55 70,99 75,00 79,84 83,25 90,57

54 53,33 55,99 58,93 62,50 67,67 72,15 76,19 81,07 84,50 91,87

55 54,33 57,02 59,98 63,58 68,80 73,31 77,38 82,29 85,75 93,17

56 55,33 58,04 61,03 64,66 69,92 74,47 78,57 83,51 86,99 94,46

57 56,33 59,06 62,08 65,74 71,04 75,62 79,75 84,73 88,24 95,75

58 57,33 60,09 63,13 66,82 72,16 76,78 80,94 85,95 89,48 97,04

59 58,33 61,11 64,18 67,89 73,28 77,93 82,12 87,17 90,72 98,32

60 59,33 62,13 65,23 68,97 74,40 79,08 83,30 88,38 91,95 99,61

61 60,33 63,16 66,27 70,05 75,51 80,23 84,48 89,59 93,19 100,89

62 61,33 64,18 67,32 71,13 76,63 81,38 85,65 90,80 94,42 102,17

63 62,33 65,20 68,37 72,20 77,75 82,53 86,83 92,01 95,65 103,44

64 63,33 66,23 69,42 73,28 78,86 83,68 88,00 93,22 96,88 104,72

65 64,33 67,25 70,46 74,35 79,97 84,82 89,18 94,42 98,11 105,99

66 65,33 68,27 71,51 75,42 81,09 85,96 90,35 95,63 99,33 107,26

67 66,33 69,29 72,55 76,50 82,20 87,11 91,52 96,83 100,55 108,53

68 67,33 70,32 73,60 77,57 83,31 88,25 92,69 98,03 101,78 109,79

69 68,33 71,34 74,64 78,64 84,42 89,39 93,86 99,23 103,00 111,06

70 69,33 72,36 75,69 79,71 85,53 90,53 95,02 100,43 104,21 112,32

Page 93: Statistik - Gratis Kompendium - manan.dkmanan.dk/wp-content/uploads/2014/03/brink_david_statistik... · Statistisk testteori 7.1 Nulhypotese og alternativ hypotese 7.2 SigniÞ kanssandsynlighed

Download gratis bøger på ventus.dk / BookBooN.com

93

Lær Nemt! Statistik Tabeller

C.4 Student’s t-fordeling (værdier x med FStudent(x) = 0,600 etc.)

df 0,600 0,700 0,800 0,900 0,950 0,975 0,990 0,995 0,999

1 0,32 0,73 1,38 3,08 6,31 12,71 31,82 63,66 318,31

2 0,29 0,62 1,06 1,89 2,92 4,30 6,96 9,92 22,33

3 0,28 0,58 0,98 1,64 2,35 3,18 4,54 5,84 10,2

4 0,27 0,57 0,94 1,53 2,13 2,78 3,75 4,60 7,17

5 0,27 0,56 0,92 1,48 2,02 2,57 3,36 4,03 5,89

6 0,26 0,55 0,91 1,44 1,94 2,45 3,14 3,71 5,21

7 0,26 0,55 0,90 1,41 1,89 2,36 3,00 3,50 4,79

8 0,26 0,55 0,89 1,40 1,86 2,31 2,90 3,36 4,50

9 0,26 0,54 0,88 1,38 1,83 2,26 2,82 3,25 4,30

10 0,26 0,54 0,88 1,37 1,81 2,23 2,76 3,17 4,14

11 0,26 0,54 0,88 1,36 1,80 2,20 2,72 3,11 4,02

12 0,26 0,54 0,87 1,36 1,78 2,18 2,68 3,05 3,93

13 0,26 0,54 0,87 1,35 1,77 2,16 2,65 3,01 3,85

14 0,26 0,54 0,87 1,35 1,76 2,14 2,62 2,98 3,79

15 0,26 0,54 0,87 1,34 1,75 2,13 2,60 2,95 3,73

16 0,26 0,54 0,86 1,34 1,75 2,12 2,58 2,92 3,69

17 0,26 0,53 0,86 1,33 1,74 2,11 2,57 2,90 3,65

18 0,26 0,53 0,86 1,33 1,73 2,10 2,55 2,88 3,61

19 0,26 0,53 0,86 1,33 1,73 2,09 2,54 2,86 3,58

20 0,26 0,53 0,86 1,33 1,72 2,09 2,53 2,85 3,55

21 0,26 0,53 0,86 1,32 1,72 2,08 2,52 2,83 3,53

22 0,26 0,53 0,86 1,32 1,72 2,07 2,51 2,82 3,50

23 0,26 0,53 0,86 1,32 1,71 2,07 2,50 2,81 3,48

24 0,26 0,53 0,86 1,32 1,71 2,06 2,49 2,80 3,47

25 0,26 0,53 0,86 1,32 1,71 2,06 2,49 2,79 3,45

26 0,26 0,53 0,86 1,31 1,71 2,06 2,48 2,78 3,43

27 0,26 0,53 0,86 1,31 1,70 2,05 2,47 2,77 3,42

28 0,26 0,53 0,85 1,31 1,70 2,05 2,47 2,76 3,41

29 0,26 0,53 0,85 1,31 1,70 2,05 2,46 2,76 3,40

30 0,26 0,53 0,85 1,31 1,70 2,04 2,46 2,75 3,39

35 0,26 0,53 0,85 1,31 1,69 2,03 2,44 2,72 3,34

40 0,26 0,53 0,85 1,30 1,68 2,02 2,42 2,70 3,31

50 0,25 0,53 0,85 1,30 1,68 2,01 2,40 2,68 3,26

100 0,25 0,53 0,85 1,29 1,66 1,98 2,36 2,63 3,17

∞ 0,25 0,52 0,84 1,28 1,64 1,96 2,33 2,58 3,09

Page 94: Statistik - Gratis Kompendium - manan.dkmanan.dk/wp-content/uploads/2014/03/brink_david_statistik... · Statistisk testteori 7.1 Nulhypotese og alternativ hypotese 7.2 SigniÞ kanssandsynlighed

Download gratis bøger på ventus.dk / BookBooN.com

94

Lær Nemt! Statistik Tabeller

C.5 Fishers F -fordeling (værdier x med FFisher(x) = 0,90)

1 2 3 4 5 6 7 8 9 101 39,86 49,50 53,59 55,83 57,24 58,20 58,91 59,44 59,86 60,19

2 8,53 9,00 9,16 9,24 9,29 9,33 9,35 9,37 9,38 9,39

3 5,54 5,46 5,39 5,34 5,31 5,28 5,27 5,25 5,24 5,23

4 4,54 4,32 4,19 4,11 4,05 4,01 3,98 3,95 3,94 3,92

5 4,06 3,78 3,62 3,52 3,45 3,40 3,37 3,34 3,32 3,30

6 3,78 3,46 3,29 3,18 3,11 3,05 3,01 2,98 2,96 2,94

7 3,59 3,26 3,07 2,96 2,88 2,83 2,78 2,75 2,72 2,70

8 3,46 3,11 2,92 2,81 2,73 2,67 2,62 2,59 2,56 2,54

9 3,36 3,01 2,81 2,69 2,61 2,55 2,51 2,47 2,44 2,42

10 3,29 2,92 2,73 2,61 2,52 2,46 2,41 2,38 2,35 2,32

11 3,23 2,86 2,66 2,54 2,45 2,39 2,34 2,30 2,27 2,25

12 3,18 2,81 2,61 2,48 2,39 2,33 2,28 2,24 2,21 2,19

13 3,14 2,76 2,56 2,43 2,35 2,28 2,23 2,20 2,16 2,14

14 3,10 2,73 2,52 2,39 2,31 2,24 2,19 2,15 2,12 2,10

15 3,07 2,70 2,49 2,36 2,27 2,21 2,16 2,12 2,09 2,06

16 3,05 2,67 2,46 2,33 2,24 2,18 2,13 2,09 2,06 2,03

17 3,03 2,64 2,44 2,31 2,22 2,15 2,10 2,06 2,03 2,00

18 3,02 2,62 2,42 2,29 2,20 2,13 2,08 2,04 2,00 1,98

19 3,01 2,61 2,40 2,27 2,18 2,11 2,06 2,02 1,98 1,96

20 3,00 2,59 2,38 2,25 2,16 2,09 2,04 2,00 1,96 1,94

21 2,98 2,57 2,36 2,23 2,14 2,08 2,02 1,98 1,95 1,92

22 2,97 2,56 2,35 2,22 2,13 2,06 2,01 1,97 1,93 1,90

23 2,96 2,55 2,34 2,21 2,11 2,05 1,99 1,95 1,92 1,89

24 2,95 2,54 2,33 2,19 2,10 2,04 1,98 1,94 1,91 1,88

25 2,94 2,53 2,32 2,18 2,09 2,02 1,97 1,93 1,89 1,87

26 2,93 2,52 2,31 2,17 2,08 2,01 1,96 1,92 1,88 1,86

27 2,92 2,51 2,30 2,17 2,07 2,00 1,95 1,91 1,87 1,85

28 2,92 2,50 2,29 2,16 2,06 2,00 1,94 1,90 1,87 1,84

29 2,91 2,50 2,28 2,15 2,06 1,99 1,93 1,89 1,86 1,83

30 2,90 2,49 2,28 2,14 2,05 1,98 1,93 1,88 1,85 1,82

31 2,90 2,48 2,27 2,14 2,04 1,97 1,92 1,88 1,84 1,81

32 2,89 2,48 2,26 2,13 2,04 1,97 1,91 1,87 0,84 1,81

33 2,89 2,47 2,26 2,12 2,03 1,96 1,91 1,86 1,83 1,80

34 2,88 2,47 2,25 2,12 2,02 1,96 1,90 1,86 1,82 1,79

35 2,88 2,46 2,25 2,11 2,02 1,95 1,90 1,85 1,82 1,79

Page 95: Statistik - Gratis Kompendium - manan.dkmanan.dk/wp-content/uploads/2014/03/brink_david_statistik... · Statistisk testteori 7.1 Nulhypotese og alternativ hypotese 7.2 SigniÞ kanssandsynlighed

Download gratis bøger på ventus.dk / BookBooN.com

95

Lær Nemt! Statistik Tabeller

C.6 Fishers F -fordeling (værdier x med FFisher(x) = 0,95)

1 2 3 4 5 6 7 8 9 101 161,45 199,50 215,71 224,58 230,16 233,99 236,77 238,88 240,54 241,88

2 18,51 19,00 19,16 19,25 19,30 19,33 19,35 19,37 19,38 19,40

3 10,13 9,55 9,28 9,12 9,01 8,94 8,89 8,85 8,81 8,79

4 7,71 6,94 6,59 6,39 6,26 6,16 6,09 6,04 6,00 5,96

5 6,61 5,79 5,41 5,19 5,05 4,95 4,88 4,82 4,77 4,74

6 5,99 5,14 4,76 4,53 4,39 4,28 4,21 4,15 4,10 4,06

7 5,59 4,74 4,35 4,12 3,97 3,87 3,79 3,73 3,68 3,64

8 5,32 4,46 4,07 3,84 3,69 3,58 3,50 3,44 3,39 3,35

9 5,12 4,26 3,86 3,63 3,48 3,37 3,29 3,23 3,18 3,14

10 4,96 4,10 3,71 3,48 3,33 3,22 3,14 3,07 3,02 2,98

11 4,84 3,98 3,59 3,36 3,20 3,09 3,01 2,95 2,90 2,85

12 4,75 3,89 3,49 3,26 3,11 3,00 2,91 2,85 2,80 2,75

13 4,67 3,81 3,41 3,18 3,03 2,92 2,83 2,77 2,71 2,67

14 4,60 3,74 3,34 3,11 2,96 2,85 2,76 2,70 2,65 2,60

15 4,54 3,68 3,29 3,06 2,90 2,79 2,71 2,64 2,59 2,54

16 4,49 3,63 3,24 3,01 2,85 2,74 2,66 2,59 2,54 2,49

17 4,45 3,59 3,20 2,96 2,81 2,70 2,61 2,55 2,49 2,45

18 4,43 3,55 3,16 2,93 2,77 2,66 2,58 2,51 2,46 2,41

19 4,41 3,52 3,13 2,90 2,74 2,63 2,54 2,48 2,42 2,38

20 4,38 3,49 3,10 2,87 2,71 2,60 2,51 2,45 2,39 2,35

21 4,35 3,47 3,07 2,84 2,68 2,57 2,49 2,42 2,37 2,32

22 4,33 3,44 3,05 2,82 2,66 2,55 2,46 2,40 2,34 2,30

23 4,31 3,42 3,03 2,80 2,64 2,53 2,44 2,37 2,32 2,27

24 4,29 3,40 3,01 2,78 2,62 2,51 2,42 2,36 4,62 2,25

25 4,27 3,39 2,99 2,76 2,60 2,49 2,40 2,34 2,28 2,24

26 4,25 3,37 2,98 2,74 2,59 2,47 2,39 2,32 2,27 2,22

27 4,24 3,35 2,96 2,73 2,57 2,46 2,37 2,31 2,25 2,20

28 4,22 3,34 2,95 2,71 2,56 2,45 2,36 2,29 2,24 2,19

29 4,21 3,33 2,93 2,70 2,55 2,43 2,35 2,28 2,22 2,18

30 4,20 3,32 2,92 2,69 2,53 2,42 2,33 2,27 2,21 2,16

31 4,18 3,30 2,91 2,68 2,52 2,41 2,32 2,25 2,20 2,15

32 4,17 3,29 2,90 2,67 2,51 2,40 2,31 2,24 2,19 2,14

33 4,16 3,28 2,89 2,66 2,50 2,39 2,30 2,23 2,18 2,13

34 4,15 3,28 2,88 2,65 2,49 2,38 2,29 2,23 2,17 2,12

35 4,15 3,27 2,87 2,64 2,49 2,37 2,29 2,22 2,16 2,11

Page 96: Statistik - Gratis Kompendium - manan.dkmanan.dk/wp-content/uploads/2014/03/brink_david_statistik... · Statistisk testteori 7.1 Nulhypotese og alternativ hypotese 7.2 SigniÞ kanssandsynlighed

Download gratis bøger på ventus.dk / BookBooN.com

96

Lær Nemt! Statistik Tabeller

C.7 Fishers F -fordeling, (værdier x med FFisher(x) = 0,99)

1 2 3 4 5 6 7 8 9 101 4052 5000 5403 5625 5764 5859 5928 5981 6022 6056

2 98,50 99,00 99,17 99,25 99,30 99,33 99,36 99,37 99,39 99,40

3 34,12 30,82 29,46 28,71 28,24 27,91 27,67 27,49 27,35 27,23

4 21,20 18,00 16,69 15,98 15,52 15,21 14,98 14,80 14,66 14,55

5 16,26 13,27 12,06 11,39 10,97 10,67 10,46 10,29 10,16 10,05

6 13,75 10,92 9,78 9,15 8,75 8,47 8,26 8,10 7,98 7,87

7 12,25 9,55 8,45 7,85 7,46 7,19 6,99 6,84 6,72 6,62

8 11,26 8,65 7,59 7,01 6,63 6,37 6,18 6,03 5,91 5,81

9 10,56 8,02 6,99 6,42 6,06 5,80 5,61 5,47 5,35 5,26

10 10,04 7,56 6,55 5,99 5,64 5,39 5,20 5,06 4,94 4,85

11 9,65 7,21 6,22 5,67 5,32 5,07 4,89 4,74 4,63 4,54

12 9,33 6,93 5,95 5,41 5,06 4,82 4,64 4,50 4,39 4,30

13 9,07 6,70 5,74 5,21 4,86 4,62 4,44 4,30 4,19 4,10

14 8,86 6,51 5,56 5,04 4,69 4,46 4,28 4,14 4,03 3,94

15 8,68 6,36 5,42 4,89 4,56 4,32 4,14 4,00 3,89 3,80

16 8,53 6,23 5,29 4,77 4,44 4,20 4,03 3,89 3,78 3,69

17 8,40 6,11 5,18 4,67 4,34 4,10 3,93 3,79 3,68 3,59

18 8,30 6,01 5,09 4,58 4,25 4,01 3,84 3,71 3,60 3,51

19 8,22 5,93 5,01 4,50 4,17 3,94 3,77 3,63 3,52 3,43

20 8,13 5,85 4,94 4,43 4,10 3,87 3,70 3,56 3,46 3,37

21 8,05 5,78 4,87 4,37 4,04 3,81 3,64 3,51 3,40 3,31

22 7,98 5,72 4,82 4,31 3,99 3,76 3,59 3,45 3,35 3,26

23 7,91 5,66 4,76 4,26 3,94 3,71 3,54 3,41 3,30 3,21

24 7,85 5,61 4,72 4,22 3,90 3,67 3,50 3,36 3,26 3,17

25 7,80 5,57 4,68 4,18 3,85 3,63 3,46 3,32 3,22 3,13

26 7,75 5,53 4,64 4,14 3,82 3,59 3,42 3,29 3,18 3,09

27 7,71 5,49 4,60 4,11 3,78 3,56 3,39 3,26 3,15 3,06

28 7,67 5,45 4,57 4,07 3,75 3,53 3,36 3,23 3,12 3,03

29 7,63 5,42 4,54 4,04 3,73 3,50 3,33 3,20 3,09 3,00

30 7,59 5,39 4,51 4,02 3,70 3,47 3,30 3,17 3,07 2,98

31 7,56 5,36 4,48 3,99 3,67 3,45 3,28 3,15 3,04 2,96

32 7,53 5,34 4,46 3,97 3,65 3,43 3,26 3,13 3,02 2,93

33 7,50 5,31 4,44 3,95 3,63 3,41 3,24 3,11 3,00 2,91

34 7,47 5,29 4,42 3,93 3,61 3,39 3,22 3,09 2,98 2,89

35 7,45 5,27 4,40 3,91 3,59 3,37 3,20 3,07 2,96 2,88

Page 97: Statistik - Gratis Kompendium - manan.dkmanan.dk/wp-content/uploads/2014/03/brink_david_statistik... · Statistisk testteori 7.1 Nulhypotese og alternativ hypotese 7.2 SigniÞ kanssandsynlighed

Download gratis bøger på ventus.dk / BookBooN.com

97

Lær Nemt! Statistik Tabeller

C.8 Wilcoxons test for et sæt observationern 0,005 0,010 0,025 0,0505 − − − 06 − − 0 27 − 0 2 38 0 1 3 59 1 3 5 8

10 3 5 8 1011 5 7 10 1312 7 9 13 1713 9 12 17 2114 12 15 21 2515 15 19 25 3016 19 23 29 3517 23 27 34 4118 27 32 40 4719 32 37 46 5320 37 43 52 6021 42 49 58 6722 48 55 65 7523 54 62 73 8324 61 69 81 9125 68 76 89 10026 75 84 98 11027 83 92 107 119

n 0,005 0,010 0,025 0,05028 91 101 116 13029 100 110 126 14030 109 120 137 15131 118 130 147 16332 128 140 159 17533 138 151 170 18734 148 162 182 20035 159 173 195 21336 171 185 208 22737 182 198 221 24138 194 211 235 25639 207 224 249 27140 220 238 264 28641 233 252 279 30242 247 266 294 31943 261 281 310 33644 276 296 327 35345 291 312 343 37146 307 328 361 38947 322 345 378 40748 339 362 396 42649 355 379 415 44650 373 397 434 466

Det er meget sjældent træerne vokser helt ind i himlen…

www.greens.dkKLIK HER

Det sker faktisk aldrig. De senere år har afsløret store erhvervsskandaler hvor der har bl.a. har været pyntet på CV’er og generelle informationer om bestyrelsesposter i dansk erhvervsliv. Du kan ikke regne med at det du får fortalt altid er det rigtige og det er faktisk sandt at det ofte er de bedste kunder og leverandører, der pludselig går konkurs – med efterfølgende tab for dig og din virksomhed.

Du kan prøve Greens Erhvervsinformation i hele din studieperiode – helt uden beregning. Her kan du bl.a. følge Rigmor Zobels bestyrelseskarriere, Stein Baggers samarbejdspartnere, og hvem Christian Stadil tænder røgelsespinde sammen med. Kontakt os på [email protected] for at få et brugernavn og password så du allerede kan komme i gang i dag.

Via Greens Online har du altid adgang til:

• Fuldt opdaterede personbiografier på mere end 10.000 erhvervsledere

• Information om samtlige direktions- og bestyrelsesmedlemmer i Danmark

• Virksomhedsinformation på alle danske aktie- og anpartsselskaber

• Adgang til komplette årsregnskaber 5 år tilbage• Avisartikler om virksomheder og personer• Overvågning, der altid sikrer dig de nyeste information i

din mailboks

Klik

rekl

amen

Page 98: Statistik - Gratis Kompendium - manan.dkmanan.dk/wp-content/uploads/2014/03/brink_david_statistik... · Statistisk testteori 7.1 Nulhypotese og alternativ hypotese 7.2 SigniÞ kanssandsynlighed

Download gratis bøger på ventus.dk / BookBooN.com

98

Lær Nemt! Statistik Tabeller

C.9 Wilcoxons test for 2 sæt observationer, α = 5%

m = 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15n = 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0

2 2 2 2 2 3 3 3 4 4 4 4 5 5 6 63 5 5 6 6 7 8 8 9 10 10 11 11 12 13 134 9 9 10 11 12 13 14 15 16 17 18 19 20 21 225 14 15 16 17 19 20 21 23 24 26 27 28 30 31 336 20 21 23 24 26 28 29 31 33 35 37 38 40 42 447 27 28 30 32 34 36 39 41 43 45 47 49 52 54 568 35 37 39 41 44 46 49 51 54 56 59 62 64 67 699 44 46 49 51 54 57 60 63 66 69 72 75 78 81 84

10 54 56 59 62 66 69 72 75 79 82 86 89 92 96 9911 65 67 71 74 78 82 85 89 93 97 100 104 108 112 11612 77 80 83 87 91 95 99 104 108 112 116 120 125 129 13313 90 93 97 101 106 110 115 119 124 128 133 138 142 147 15214 104 108 112 116 121 126 131 136 141 146 151 156 161 166 17115 119 123 127 132 138 143 148 153 159 164 170 175 181 186 19216 135 139 144 150 155 161 166 172 178 184 190 196 201 207 21317 152 156 162 168 173 179 186 192 198 204 210 217 223 230 23618 170 175 180 187 193 199 206 212 219 226 232 239 246 253 25919 190 194 200 207 213 220 227 234 241 248 255 262 270 277 28420 210 214 221 228 235 242 249 257 264 272 279 287 294 302 31021 231 236 242 250 257 265 272 280 288 296 304 312 320 328 33622 253 258 265 273 281 289 297 305 313 321 330 338 347 355 36423 276 281 289 297 305 313 322 330 339 348 357 366 374 383 39224 300 306 313 322 330 339 348 357 366 375 385 394 403 413 42225 325 331 339 348 357 366 375 385 394 404 414 423 433 443 453

Page 99: Statistik - Gratis Kompendium - manan.dkmanan.dk/wp-content/uploads/2014/03/brink_david_statistik... · Statistisk testteori 7.1 Nulhypotese og alternativ hypotese 7.2 SigniÞ kanssandsynlighed

Download gratis bøger på ventus.dk / BookBooN.com

99

Lær Nemt! Statistik Symbolforklaring

D Symbolforklaring

A,B, C hændelser

Ω udfaldsrum

P sandsynlighedsfunktion, signifikanssandsynlighed

A � Ω A er en delmængde af Ωω ∈ Ω ω tilhører Ωf : Ω → R f er en afbildning fra Ω ind i R

R de reelle tal

Ø den tomme mængde

X, Y stokastiske variable

E(X) middelværdien af X

var(X) variansen af X

Cov(X, Y ) covariansen af X og Y

μ middelværdi

σ2 varians

σ spredning

Bin binomialfordeling

Pois Poissonfordeling

Geo geometrisk fordeling

HG hypergeometrisk fordeling

Mult Multinomialfordeling

NB negativ binomialfordeling

Eks eksponentialfordeling

N normalfordeling

s2 empirisk varians

s empirisk spredning

F (x) fordelingsfunktion

f(x) tæthedsfunktion

Φ(x) fordelingsfunktion for standardnormalfordelingen

ϕ(x) tæthedsfunktion for standardnormalfordelingen

n antal observationer eller forsøg

λ intensitet (i Poissonproces)

R2 determinationskoefficient

ρ korrelationskoefficient

x, y gennemsnit

df antal frihedsgrader

Page 100: Statistik - Gratis Kompendium - manan.dkmanan.dk/wp-content/uploads/2014/03/brink_david_statistik... · Statistisk testteori 7.1 Nulhypotese og alternativ hypotese 7.2 SigniÞ kanssandsynlighed

Download gratis bøger på ventus.dk / BookBooN.com

100

Lær Nemt! Statistik Indeks

Indeksaccept, 23

additionsformel, 18

alternativ hypotese, 23

ANOVA, 50

antalsparameter, 25

betinget sandsynlighed, 9

binomialfordeling, 25

binomialkoefficient, 12

centrale grænseværdisætning, 20

Chebyshevs ulighed, 20

chi-kvadrat, 53

chi-kvadrat-fordeling, 42

covarians, 19

disjunkte hændelser, 8

diskrepansen, 54

diskret stokastisk variabel, 14

eksponentialfordeling, 38

empirisk covarians, 23

empirisk korrelationskoefficient, 23

empirisk spredning, 22

empirisk varians, 22

Enhedslisten, 28

F-fordeling, 43

fejl af type I og II, 24

fiaskosandsynlighed, 25

Fisher’s eksakte test, 62

Fisher’s F, 43

Fisher-Behrens-problemet, 47

fordelingsfri test, 63

fordelingsfunktion, 14

fordelingslighed, 53

forkastelse, 23

forklarende variabel, 67

forudsagt værdi, 68

forventet antal, 54

Frederiksberg Byrad, 34

French Open, 9

generaliserede binomialkoefficienter, 13

gennemsnit, 22

geometrisk fordeling, 32

Gesetz der kleinen Zahlen, 58

goodness of fit, 53

hændelse, 8

hypergeometrisk fordeling, 34

ikke-parametrisk test, 63

inklusion-eksklusion, 10

intensitet, 28, 38

kast med mønt, 21

kast med terning, 8

kontingenstabel, 59

kontinuert stokastisk variabel, 15

korrelationskoefficient, 19

kumulerede sandsynligheder, 25

kvartil, 22

kvartilafstand, 22

lineær regression, 67

marginal tæthed, 16

median, 22

middelværdi, 17, 18

multinomialfordelingen, 35

multinomialkoefficienter, 13

multiplikationsformel, 18

nedre kvartil, 22

negativ binomialfordeling, 37

normalfordeling, 38

normeret sum, 20

nulhypotese, 23

observeret antal, 54

opsplitning i mulige arsager, 9

Pascals trekant, 12

Pearson’s test, 53

Poissonfordeling, 28

Page 101: Statistik - Gratis Kompendium - manan.dkmanan.dk/wp-content/uploads/2014/03/brink_david_statistik... · Statistisk testteori 7.1 Nulhypotese og alternativ hypotese 7.2 SigniÞ kanssandsynlighed

Download gratis bøger på ventus.dk / BookBooN.com

101

Lær Nemt! Statistik Indeks

pooled varians, 48

punktsandsynlighed, 14

røde kugler, 34

rangtal, 63

regression, 67

residual, 68

responsvariabel, 67

restled, 67

sandsynlighedsfelt, 8

sandsynlighedsfunktion, 8

sandsynlighedsparameter, 25

signifikansniveau, 24

signifikanssandsynlighed, 24

simpel lineær regression, 67

simultan fordelingsfunktion, 16

simultan tæthed, 16

Skoda, 30

skoleklasse, 11

sorte kugler, 34

spontan begivenhed, 28, 38

spredning, 17

standardiserede residualer, 54, 60

standardnormalfordeling, 39

stokastisk variabel, 13

stokastisk vektor, 16

store tals lov, 20

Student’s t, 43

styrke, 24

t-fordeling, 43

tæthed, 15

tæthedsfunktion, 15

test, 23

to gange to-tabel, 61

type I og type II, 24

uafhængige hændelser, 9

uafhængige stokastiske variable, 15

udfald, 8

udfaldsrum, 8

urne, 34

varians, 17, 18

variansanalyse, 50

Wilcoxons test, 63

øjeblik af overordentlig skønhed, 21

øvre kvartil, 22