Upload
azize
View
54
Download
0
Embed Size (px)
DESCRIPTION
Akademi Merkonomer Statistik Aften 5. 2011.10.25 [email protected]. Denne aften. Introduktion til dagen Afleveringen Hypoteser 6 Skridt til hypotesetest Evaluering. Normalitet. Vi kan gå ud fra normalfordeling når Normalfordelt population Ens fordelt uafhængig stikprøve med - PowerPoint PPT Presentation
Citation preview
Akademi MerkonomerStatistikAften 5
Introduktion til dagen Afleveringen Hypoteser 6 Skridt til hypotesetest Evaluering
Denne aften
Vi kan gå ud fra normalfordeling når
Normalfordelt population
Ens fordelt uafhængig stikprøve med ◦ Centrale Grænseværdisætning Sætning 6.6
Binomial fordelt stikprøve med
Poisson fordelt stikprøve med
Normalitet
Estimat Middelværdi og SpredningBedste estimator for populationsmiddelværdi i normalfordeling er stikprøvegennemsnittet
Bedste estimator for populationsvariansen i normalfordeling er stikprøvevariansen
Bedste estimator populationsspredningen i normalfordeling er
Standard Normal FordelingenLad med Middelværdi.: og Varians.: Så Tæthedsfunktion.:
Fordelingsfunktion.:
Tabel + ExcellTabelopslag, Standard Normal fordeling og Normal Fordeling Lad 𝑿∼ 𝑵(𝟎,𝟏) De fire mest benyttede fraktiler (læg mærke til symmetri), 𝒛𝟗𝟓%,𝒛𝟗𝟕,𝟓%,𝒛𝟓%,𝒛𝟐,𝟓%
BeWI.: - BeWI->2.->D.->Fraktiler - BeWI->2.->E.->Fraktiler (ved ikke standardiseret)
Excell.: =STANDARDNORMFORDELING(x) =STANDARDNORMINV(fraktil) =NORMFORDELING(x,𝜇,𝜎,[0,1])
Konfidensinterval MiddelværdiKonfidensintervallet for middelværdien beskriver ss. for at populationens sande middelværdi 𝝁 er i nærheden af stikprøvens middelværdi 𝑿ഥ. Sandsynlighedsparametere udtrykkes negativt ved 𝜶, der er ss. for at 𝝁 ikke er tæt på 𝑿ഥ, vi taler derfor om et 𝟏 − 𝜶 konfidensinterval Herunder er 𝜶= % og derfor er 𝟏 − 𝜶= 𝟗𝟓% , altså er der 𝟗𝟓% ss. for at 𝝁 ligger inden for det angivne interval omkring 𝑿ഥ.
Hvis populationens sande varians er kendt, da er S= 𝝈 og ved brug af CLT får vi 𝑿ഥ− 𝒛𝟏−𝜶/𝟐 ⋅ 𝝈/ξ𝒏< 𝜇< 𝑿ഥ+ 𝒛𝟏−𝜶/𝟐 ⋅ 𝝈/ξ𝒏
𝝁 𝑿ഥ
𝒔
Vi kender approximationerne𝑿∼ 𝑵ሺ𝝁,𝝈𝟐/𝒏ሻ 𝒏 ≥ 𝟑𝟎
𝑿∼ 𝒕ሺ𝒗ሻ 𝒏< 30
𝑿∼ 𝒃ሺ𝒏,𝒑ሻ→ 𝑿∼ 𝑵ሺ𝒏𝒑,𝒏𝒑(𝟏 − 𝒑)/𝒏ሻ 𝒇𝒐𝒓 𝒏𝒑≥ 𝟏𝟎
𝑿∼ 𝒑𝒐ሺ𝝀ሻ→ 𝑿∼ 𝑵ሺ𝝀,𝝀/𝒏ሻ 𝒇𝒐𝒓 𝝀≥ 𝟏𝟎
𝝌𝟐− 𝒇𝒐𝒓𝒅𝒆𝒍𝒊𝒏𝒈𝒆𝒏
Idet hvorfor der gælder for stikprøvegælder at
Hvis fordelt
Hvor.: Amerikansk retssalsdrama ca.1960-1980
Emne.: Racediskrimination i sydstaterneHvid/Sort fordeling i sydstaterne.: 50-50Hvad.: 80 personers panel af mulige
jurymedl.Hvordan.: 4 sorte af de 80
Er det nu fair?Binomial fordeling med p=0,5
En hypotese
Hypotesetest.:
I en ny stikprøve, hvad er da chancen for at få et resultat, der er ligeså langt ude eller værre ?
Hvad er chancen
Chancen for 4xRoyal Straight Flush i streg
En sammenligning 5
muligheder for 5 kort
4 muligheder for Royal Straigh Flush
Så chance for 1 RSF.: 4/2.598960
Chance for 4 RSF i træk.:
Chance for 4 ud af 80.:
Virker ikke som en fair jurysammensætning,Og vi har brugt til
sammenligning.
KI – konfidensinterval
KV - Kritisk værdi, bruger
SS – Sandsynlighed
Mere og mere oplysende;Imellem, sammenlignende, sandsynliggørende
Bemærk.: Alle beregninger giver samme resultat
3 måder at teste (jo mere vi ved)
-værdi
Tre måder at evaluere hypoteser
Højresidet Venstresidet Tosidet
Nulhypotesen◦ Normalt afspejle det er ren chance◦ Hvis sand, ”FORKASTES EJ”
Alternativ hypotesenSKAL enten.:
a) Afspejle stikprøvens resultat, ellerb) Være samstemmende med forhåndsteoric) Der er en effekt
◦ Hvis sand, ”FORKASTES NULHYPOTESEN”
Én måde at formulere nul-hypotese
To måder at fejle I
Vi skal dømme, enter er.: X er uskyldig i mord.: X er skyldig i mord
X er uskyldig(H0 er sand)
X er skyldig(H0 er falsk)
X frikendes(H0 forkastes ej) Alt er godt Type 2 Fejl
X dømmes(H0 forkastes) Type 1 Fejl Alt er godt
Hvad betyder det for banken ?.: Kunden er ikke kreditværdig.: Kunden er kreditværdig
To måder at fejle II
X ikke kreditværdig (H0 er sand)
X er kreditværdig(H0 er falsk)
X får ikke et lån(H0 forkastes ikke) Alt er godt Type 2 Fejl
X får et lån(H0 forkastes) Type 1 Fejl Alt er godt
Bemærk.: Signifikans og Styrke er omvendt proportionale.
To måder at fejle III Testens signifikansniveau
Testens styrke
𝑯𝟎 er sand 𝑯𝟎 er falsk 𝑯𝟎 forkastes ej Alt er godt (ss. 𝟏 − 𝜶)
Type 2 Fejl (ss 𝜷) 𝑯𝟎 forkastes Type 1-Fejl
(ss 𝜶) Alt er godt (ss 𝟏 − 𝜷)
Eks.: Tosidet konfidensintervalEn virksomhed producerer varer, mindst 2400 enheder i gennemsnit pr. uge, dvs. 𝝁= 𝟐𝟒𝟎𝟎 1 Stikprøve ugentligt over 50 uger vise 𝒙ഥ= 𝟐𝟒𝟑𝟎,𝒔= 𝟐𝟎𝟎 𝒊𝒊𝒅+ 𝒏≥ 𝟑𝟎 så Centrale Grænseværdi Sætning 6.6 giver 𝑿ഥ∼ 𝑵(𝟐𝟒𝟑𝟎,𝟒𝟎𝟎𝟎𝟎/𝟓𝟎) 𝑲𝑰𝟗𝟓 = 𝒙ഥ± 𝒛𝟎,𝟗𝟓𝝈ξ𝒏 = 𝟐𝟒𝟑𝟎± 𝟏,𝟗𝟔∗𝟐𝟎𝟎ξ𝟓𝟎 = ሾ𝟐𝟑𝟕𝟒,𝟔;𝟐𝟒𝟖𝟓,𝟒ሿ
Eks.: Tosidet kritisk værdiTransformation:
Kritisk værdi KV.:
I Excell.: =standardnormfordeling(0,975)=1,96 =standardnormfordeling(0,025)=-1,96 Og omvendt =standardnorminv(1,96)=0,975 =standardnorminv(-1,96)=0,025
1. Hvilken hypotesen2. Vælg fordelingen3. Fastlæg kristisk region4. Find p værdi5. Undersøg resultatet6. Tag en beslutning
Seks skridt til hypotese test
En virksomhed producerer varer, mindst 2400 enheder i gennemsnit pr. uge, dvs. 𝝁= 𝟐𝟒𝟎𝟎 1 Stikprøve ugentligt over 50 uger vise 𝒙ഥ= 𝟐𝟒𝟑𝟎,𝒔= 𝟐𝟎𝟎 Er test for andel, middelværdi, intensitet eller varians? På hvilket 𝜶− 𝐧𝐢𝐯𝐞𝐚𝐮?
1. Bestem hypotesen
2. Vælg fordeling 1 Stikprøve ugentligt over 50 uger vise 𝒙ഥ= 𝟐𝟒𝟑𝟎,𝒔= 𝟐𝟎𝟎 𝒊𝒊𝒅+ 𝒏≥ 𝟑𝟎 så Centrale Grænseværdi Sætning 6.6 giver 𝑿ഥ∼ 𝑵(𝟐𝟒𝟑𝟎,𝟒𝟎𝟎𝟎𝟎/𝟓𝟎)
(Middelværdi og 5%)
3. Bestem kritisk regionEn virksomhed producerer varer, mindst 2400 enheder i gennemsnit pr. uge, dvs. 𝝁= 𝟐𝟒𝟎𝟎 𝑿ഥ∼ 𝑵(𝟐𝟒𝟑𝟎,𝟒𝟎𝟎𝟎𝟎/𝟓𝟎)
𝑯𝟎.: 𝝁= 𝟐𝟒𝟎𝟎 𝑯𝒂 .: 𝝁≠ 𝟐𝟒𝟎𝟎 Idet følger stikprøveresultatet
4. Find p værdiBeWI-> 4. -> 1. -> z-test, tosidet
Vær obs. På at KeHaTools selv korrigerer variansen for stikprøvestørrelsen ved CLT
Test for middelværdi (z-test)
Hypoteser (tosidet test)
H0 : m = m0
HA : m ¹ m0
Input
Stikprøvestørrelse 50
Stikprøvegennemsnit 2430
Stikprøvespredning 200
Nul-værdi 2400
Resultat
Teststørrelse 1,06066
p-værdi 0,288844
5. Undersøg resultatet
6. Tag en beslutning𝑯𝟎.: 𝝁= 𝟐𝟒𝟎𝟎 𝑯𝒂 .: 𝝁≠ 𝟐𝟒𝟎𝟎
P-værdien er 0,28, hvilket er mere end 0,05, der er ej forkast testniveauet
kan ej forkastes og, det er derfor den gældende hypotese.
Overblik
Eksempelvis.:
Tidsplan
Opgaver
Grupper
KehaTools
Evaluering16