47
Pravděpodobnost a statistika Vysoká škola báňská - Technická univerzita Ostrava 23. dubna 2021 Pravděpodobnost a statistika

Pravdepodobnost a statistika - vsb.cz

  • Upload
    others

  • View
    7

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Pravdepodobnost a statistika - vsb.cz

Pravděpodobnost a statistika

Vysoká škola báňská - Technická univerzita Ostrava

23. dubna 2021

Pravděpodobnost a statistika

Page 2: Pravdepodobnost a statistika - vsb.cz

Úvod do testování hypotéz

Pravděpodobnost a statistika

Page 3: Pravdepodobnost a statistika - vsb.cz

Základní metody statistické indukce

Intervalové odhady (angl. confidence intervals) – umožňujíodhadnout nejistotu v odhadu parametru náhodné veličiny

Testování hypotéz (angl. hypothesis testing) - umožňujeposoudit, zda experimentálně získaná data nepopírajípředpoklad, který jsme před provedením testování učinili,tj. používáme, chceme-li ověřit platnost předem definovanéhypotézy (s předem danou hladinou významnosti).

Pravděpodobnost a statistika

Page 4: Pravdepodobnost a statistika - vsb.cz

Co je to statistická hypotéza?Statistická hypotéza – předpoklad (tvrzení) o rozdělení náhodnéveličiny

Příklady statistických hypotéz:

Střední životnost žárovek je nižší než výrobcem udávaných5 let.Mortalita je u laparoskopických operací nižší než u operacíkonvenčních.Průměrné výsledky srovnávacích testů závisí na typuabsolvované střední školy.Pořízený datový soubor je výběrem z populace mající normálnírozdělení.

Poznámka: Rozdíl (resp. poměr) parametru náhodné veličiny ajeho očekávané hodnoty, popřípadě rozdíl (resp. poměr) parametrůnáhodných veličin nazýváme efekt.

Pravděpodobnost a statistika

Page 5: Pravdepodobnost a statistika - vsb.cz

Typy statistických hypotéz

Parametrická statistická hypotéza – tvrzení ohledně efektuHypotézy o parametru jedné populace (o střední hodnotě,rozptylu, mediánu, parametru binomického rozdělení, . . . )Hypotézy o parametrech dvou populací (srovnávací testy)Hypotézy o parametrech více než dvou populací (ANOVA,Kruskalův-Wallisův test, . . . )

Neparametrická statistická hypotéza - tvrzení o jiné vlastnostirozdělení náhodné veličiny než o jejím parametru (např.hypotézy o typu rozdělení NV, hypotézy o závislosti NV, . . . )

Pravděpodobnost a statistika

Page 6: Pravdepodobnost a statistika - vsb.cz

Jak ověřit, zda je statistická hypotéza pravdivá?

Pravdivost nulové hypotézy nelze na základě dat dokázat !!!Pravdivost nulové hypotézy lze na základě dat pouze vyvrátit.

Nulová hypotéza(obžalovaný je nevinen)

Alternativní hypotéza(obžalovaný je vinen)

Data (výběrový soubor)(svědci)

Testové kritérium(soudce)

Princip presumpce nevinyNeodsoudí-li soudce obžalovaného, nemusí to znamenat, že je obžalovaný

nevinný. Může to znamenat, že neexistuje dostatek důkazů pro jeho odsouzení!

Pravděpodobnost a statistika

Page 7: Pravdepodobnost a statistika - vsb.cz

Co je to testování hypotéz?

Rozhodovací proces, v němž proti sobě stojí nulová aalternativní hypotéza.

Nulová hypotéza H0 – tvrzení, že efekt je nulový, resp. ženeexistuje závislost, že data mají určitý typ rozdělení, . . .

Alternativní hypotéza HA (H1) – tvrzení popírající hypotézunulovou (obvykle to, co chceme dokázat)

Pravděpodobnost a statistika

Page 8: Pravdepodobnost a statistika - vsb.cz

Příklad I

Ověřte, zda použití bezpečnostních pásů ovlivňuje úmrtnost přidopravních nehodách.

Populace 1 (základní soubor 1): Účastníci dopravních nehod, kteří sedělina místech, na nichž je možno používat bezpečnostní pásy a bylipřipoutáni.

Populace 2 (základní soubor 2): Účastníci dopravních nehod, kteří sedělina místech, na nichž je možno používat bezpečnostní pásy a nebylipřipoutáni.

Sledovaný statistický znak (náhodná veličina): úmrtnost (relativníčetnost zemřelých)

Nulová hypotéza H0: πA = πN , kde πA, resp. πN označuje úmrtnostúčastníků dopravních nehod, kteří byli, resp. nebyli připoutáni.

Alternativní hypotéza HA: πA 6= πN .

Pravděpodobnost a statistika

Page 9: Pravdepodobnost a statistika - vsb.cz

Příklad II

Ověřte, zda průměrný plat v ČR je větší než 30 000,- Kč.

Populace (základní soubor): Ekonomicky aktivní obyvatelstvo pobírajícímzdu.

Sledovaný statistický znak (náhodná veličina): mzda.

Nulová hypotéza H0: µ = 30000.

Alternativní hypotéza HA: µ > 30000.

Poznámka:Průměrný plat zjištěný z výběrového souboru by měl být větší než30 000,- Kč. Pokud by tomu tak nebylo, měli bychom použítoboustrannou alternativní hypotézu.

Pravděpodobnost a statistika

Page 10: Pravdepodobnost a statistika - vsb.cz

Jak postupovat při testování hypotéz?(klasický přístup)

1 Formulujeme nulovou a alternativní hypotézu.2 Zvolíme tzv. testovou statistiku, tj. výběrovou charakteristiku, jejíž

rozdělení závisí na testovaném parametru θ. (Rozdělení testové statistikyza předpokladu platnosti nulové hypotézy nazýváme nulové rozdělení.)

3 Ověříme předpoklady testu!4 Určíme kritický obor W ∗ tj. množinu, v níž se, za předpokladu platnosti

H0, hodnoty testové statistiky vyskytují s velmi malou pravděpodobností.

Doplňkem k W ∗ je tzv. obor přijetí V ∗.Hranici mezi kritickým oborem a oborem přijetí označujemejako kritická hodnota testu tkrit .

5 Na základě konkrétní realizace výběru určíme pozorovanou hodnotu xOBStestové statistiky.

6 Na základě vztahu mezi xOBS a tkrit rozhodneme o výsledku testu(„Zamítáme H0.“ nebo „Nezamítáme H0“. )

Pravděpodobnost a statistika

Page 11: Pravdepodobnost a statistika - vsb.cz

Příklad

Standardním výrobním způsobem lze vyrobit monitory se střední životnosti1200 hodin a směrodatnou odchylkou 300 hodin. Novou technologií, kterounavrhuje vývojové centrum bylo zkušebně vyrobeno 100 obrazovek, jejichžprůměrná životnost byla 1265 hodin. Jde o kvalitnější technologii, nejdepouze o náhodný rozdíl?

Řešení:1) H0 : µ = 1200,

HA : µ > 1200

2) T (X) = X−µσ

√n ∼ N(0; 1)

3) Ověření předpokladů testu:

Zajištění náhodného výběru je důležité již ve fázi plánováníexperimentu!Normalitu výběru je nutno ověřit!!! (např. pomocí exploračníchgrafů nebo pomocí statistického testu.)

Pravděpodobnost a statistika

Page 12: Pravdepodobnost a statistika - vsb.cz

Příklad

4) Pro určení kritického oboru je nutné předem si stanovit, jak„nepravděpodobné“ hodnoty testové statistiky již budemepovažovat za „velmi nepravděpodobné“.

z0,95 = 1, 640 W ∗

⇒ Zamítáme H0Nezamítáme H0⇐α - hladina významnosti testu

W ∗ = {xOBS |xOBS > 1, 64}

Pravděpodobnost a statistika

Page 13: Pravdepodobnost a statistika - vsb.cz

Příklad

5) xOBS = T (x)|H0 = 1265−1200300

√100 = 2, 17

6) xOBS ∈W ∗ =⇒ Na hladině významnosti 0,05 zamítáme H0 veprospěch HA.Pozorované zlepšení průměrné životnosti obrazovek je statistickyvýznamné.

Pravděpodobnost a statistika

Page 14: Pravdepodobnost a statistika - vsb.cz

Chyba I. a II. druhu

Při testování hypotéz mohou nastat čtyři situace:

Výsledek testuNezamítáme H0 Zamítáme H0

Skut

ečno

st Platí H0Správné rozhodnutíPravděpodobnost rozhodnutí: 1-α(spolehlivost)

Chyba I. druhuPravděpodobnost rozhodnutí: α(hladina významnosti)

Platí HAChyba II. druhuPravděpodobnost rozhodnutí: β

Správné rozhodnutíPravděpodobnost rozhodnutí: 1− β(síla testu)

Jelikož výběr na jehož základě rozhodujeme je náhodný, nelze sechybám I. a II. druhu vyhnout.

Chtěli bychom mít k dispozici testy s nízkou hladinou významnosti(tj. vysokou spolehlivosti) a vysokou sílou testu.

=⇒ dva protichůdné požadavky

Pravděpodobnost a statistika

Page 15: Pravdepodobnost a statistika - vsb.cz

Závěr

S klesající hladinou významnosti roste pravděpodobnost chyby II.druhu!

Existuje způsob jak snížit α i β - zvýšení rozsahu výběru.

Hladinu významnosti α volíme obvykle 0.05 (resp. 0.01).

Sílu testu lze poté ovlivnit volbou testové statistiky a dostatečnéhopočtu pozorování.

Pravděpodobnost a statistika

Page 16: Pravdepodobnost a statistika - vsb.cz

Operativní charakteristika a silofunkce

Chceme-li srovnat dva testy, porovnáme jejich operativní charakteristiky,resp. silofunkce.

Operativní charakteristika – fce vyjadřující závislostpravděpodobnosti chyby II. druhu na přesné specifikaci alternativníhypotézy

Silofunkce - fce vyjadřující závislost síly testu na přesné specifikacialternativní hypotézy

Pravděpodobnost a statistika

Page 17: Pravdepodobnost a statistika - vsb.cz

Příklad:

Výšku asijských hybridů lilií lze modelovat náhodnou veličinou s normálním rozdělenímN(100; 144). Skupina 100 kusů těchto lilií byla pěstována za příznivějších podmínek,aby se zjistilo, zda se výška zvýší.

a) Určete kritickou hodnotu průměrné výšky tohoto vzorku, při jejímž překročeníbude možno se spolehlivostí 0.95 tvrdit, že nové pěstební podmínky vedly kezvýšení střední výšky asijských hybridů lilií.

Řešení:

1. H0: µ = 100, HA: µ > 100

2. T (X) = X−µσ

√n→ N(0; 1)

3. Předpoklady testu nelze popřít.

4. W ∗ = {xOBS : xOBS > z0.95} = {xOBS : xOBS > 1.64}

xOBS =x − µσ

√n > 1.64 ⇒ x > 1.64 ·

12√100

+ 100 ' 102

Překročí-li průměrná výška 100 vzorků 102 cm, bude možno se spolehlivostí 0.95tvrdit, že nové pěstební podmínky vedly ke zvýšení střední výšky asijských hybridů lilií.

Pravděpodobnost a statistika

Page 18: Pravdepodobnost a statistika - vsb.cz

Příklad:

Výšku asijských hybridů lilií lze modelovat náhodnou veličinou s normálním rozdělenímN(100; 144). Skupina 100 kusů těchto lilií byla pěstována za příznivějších podmínek,aby se zjistilo, zda se výška zvýší.

b) Průměrná výška testovaného vzorku lilií je 102.5 cm. Ověřte klasickým testem,zda lze se spolehlivostí 0.95, resp. 0.99, tvrdit, že nové pěstební podmínky vedlyke zvýšení střední výšky asijských hybridů lilií.

Řešení:

1. H0: µ = 100, HA: µ > 100

2. T (X) = X−µσ

√n→ N(0; 1)

3. Předpoklady testu nelze popřít.4. W ∗ = {xOBS : xOBS > z0.95} = {xOBS : xOBS > 1.64}

5. xOBS = T (X)|H0 = 102.5−10012

√100 = 2.08

6. xOBS ∈W ∗ ⇒ Na hladině významnosti 0.05 zamítáme H0 ve prospěch HA.Pozorované zvýšení průměrné výšky asijských hybridů lilií je na hladiněvýznamnosti 0.05 statisticky významné.

Pravděpodobnost a statistika

Page 19: Pravdepodobnost a statistika - vsb.cz

Příklad:

Výšku asijských hybridů lilií lze modelovat náhodnou veličinou s normálním rozdělenímN(100; 144). Skupina 100 kusů těchto lilií byla pěstována za příznivějších podmínek,aby se zjistilo, zda se výška zvýší.

b) Průměrná výška testovaného vzorku lilií je 102.5 cm. Ověřte klasickým testem,zda lze se spolehlivostí 0.95, resp. 0.99, tvrdit, že nové pěstební podmínky vedlyke zvýšení střední výšky asijských hybridů lilií.

Řešení:

1. H0: µ = 100, HA: µ > 100

2. T (X) = X−µσ

√n→ N(0; 1)

3. Předpoklady testu nelze popřít.4. W ∗ = {xOBS : xOBS > z0.99} = {xOBS : xOBS > 2.33}

5. xOBS = T (X)|H0 = 102.5−10012

√100 = 2.08

6. xOBS 6∈W ∗ ⇒ Na hladině významnosti 0.01 nezamítáme H0. Pozorovanézvýšení průměrné výšky asijských hybridů lilií není na hladině významnosti 0.01statisticky významné.

Pravděpodobnost a statistika

Page 20: Pravdepodobnost a statistika - vsb.cz

p-hodnota

Nevýhodou klasického testu je skutečnost, že při pohledu na výsledektestu (vztah pozorované a kritické hodnoty) nevidíme přímo, jakrozhodnutí závisí na změně hladiny významnosti.

=⇒ často preferujeme rozhodování o výsledku testuna základě p-hodnoty (nejvyšší hladina významnosti, na níž se již nulováhypotéza nezamítá).

p-hodnota je pravděpodobnost, s jakou můžeme za předpokladu plat-nosti nulové hypotézy pozorovat takový výsledek, jaký jsme pozorovali,nebo takový, jaký nulové hypotéze odporuje ješte více než ten námi po-zorovaný.

Pravděpodobnost a statistika

Page 21: Pravdepodobnost a statistika - vsb.cz

Čistý test významnosti aneb testování pomoci p-hodnoty

Postup při čistém testu významnosti

1 Formulace nulové a alternativní hypotézy.2 Volba testové statistiky (testového kritéria) T(X).3 Ověření předpokladů testu.4 Výpočet pozorované hodnoty xOBS testové statistiky T(X).5 Výpočet p-hodnoty (angl. „p-value“ nebo „significance level“).

Tvar alternativní hypotézy HA p-hodnotaθ < θ0 p-hodnota = F0(xOBS)θ > θ0 p-hodnota = 1− F0(xOBS)θ 6= θ0 p-hodnota = 2min{F0(xOBS); 1− F0(xOBS)}

6 Rozhodnutí o výsledku testu.

p-hodnota Rozhodnutíp-hodnota < α Zamítáme H0 ve prospěch HA.p-hodnota ≥ α Nezamítáme H0.

Pravděpodobnost a statistika

Page 22: Pravdepodobnost a statistika - vsb.cz

Příklad

Výšku asijských hybridů lilií lze modelovat náhodnou veličinou s normálnímrozdělením N(100; 144). Skupina 100 kusů těchto lilií byla pěstována zapříznivějších podmínek, aby se zjistilo, zda se výška zvýší. Ověřte čistým testemvýznamnosti, zda lze se spolehlivosti 0, 95, resp. 0, 99, tvrdit, že nové pěstebnípodmínky vedly ke zvýšení střední výšky asijských hybridů lilií.

Řešení:

H0 : µ = 100HA : µ > 100

T (X) = X−µσ

√n ∼ N(0; 1)

Předpoklady testu nelze popřít.xOBS = T (x)|H0 = 102.5−100

12

√100 = 2.08

p-hodnota = 1− F0(2.08) = 1− Φ(2.08) = 0.019p-hodnota < 0.05⇒ Na hladině významnosti 0.05 zamítáme H0 veprospěch HA. Pozorované zvýšení průměrné výšky asijských hybridů lilii jena hladině významnosti 0.05 statisticky významné.

Pravděpodobnost a statistika

Page 23: Pravdepodobnost a statistika - vsb.cz

Příklad

Výšku asijských hybridů lilií lze modelovat náhodnou veličinou s normálnímrozdělením N(100; 144). Skupina 100 kusů těchto lilií byla pěstována zapříznivějších podmínek, aby se zjistilo, zda se výška zvýší. Ověřte čistým testemvýznamnosti, zda lze se spolehlivosti 0, 95, resp. 0, 99, tvrdit, že nové pěstebnípodmínky vedly ke zvýšení střední výšky asijských hybridů lilií.

Řešení:

H0 : µ = 100HA : µ > 100

T (X) = X−µσ

√n ∼ N(0; 1)

Předpoklady testu nelze popřít.xOBS = T (x)|H0 = 102.5−100

12

√100 = 2.08

p-hodnota = 1− F0(2.08) = 1− Φ(2.08) = 0.019p-hodnota > 0.01⇒ Na hladině významnosti 0.01 nezamítáme H0.Pozorované zvýšení průměrné výšky asijských hybridů lilii není na hladiněvýznamnosti 0.01 statisticky významné.

Pravděpodobnost a statistika

Page 24: Pravdepodobnost a statistika - vsb.cz

Několik poznámek pro praxi

Pozor na pečlivé plánování experimentu! (Nutno zajistit nezávislostpokusů, eliminaci vlivů nežádoucích faktorů, dostatečný rozsah výběru(výsledky testu nelze upravovat tím, že dodatečně rozšíříme výběrovýsoubor), . . . )

Příklad: Včely jsou postupně vypouštěny do pokusného prostoru sežlutými, červenými a modrými terči. Sledujeme barvu terče, na kterýkaždá včela poprvé usedne. Nulová hypotéza je, že pravděpodobnostusednutí nezávisí na barvě terče (tímto způsobem zjišujeme, zda se včelyvizuálně orientují a zda při této orientaci hrají nějakou úlohu barvy).(Lepš, Kapitola 2 –testování hypotéz, test dobré shody, online:http://botanika.bf.jcu.cz/suspa/vyuka/materialy/KAP2.pdf [2012-03-19])

Co všechno je třeba při pokusu zajistit?

vypouštění včel po jednotlivcích,včely nesmí zanechávat stopy o své návštěvě terče (není-lisplněno, nutná výměna terčů po každém pokusu),předem daný počet pokusů.

Pravděpodobnost a statistika

Page 25: Pravdepodobnost a statistika - vsb.cz

Několik poznámek pro praxi

V odborných pracích většinou výsledky testování hypotézprezentujeme ve tvaru: (název testu, pozorovaná hodnota, testovéstatistiky, p-hodnota)+někdy doplňujeme další parametry testu(např. stupně volnosti u χ2 testu dobré shody).Např.: Předpoklad normality byl na hladině významnosti 0, 05zamítnut (χ2 test dobré shody; χ2 = 14, 9; df = 6;p − hodnota = 0, 021).

Pokud je výstupem software: p − hodnota = 0, znamená to, žep − hodnota je menší než přesnost softwaru. Do odborných textůnikdy NEPIŠTE p − hodnota = 0, ale např. p − hodnota� 0, 01.

Uvědomte si, co to znamená, když p − hodnota→ 1Příliš dobrá shoda dat s nulovou hypotézou je podezřelá, angl. „Toogood to be true“

Pravděpodobnost a statistika

Page 26: Pravdepodobnost a statistika - vsb.cz

Statistická vs. praktická významnost

Rozhodnutí o výsledku statistického testu je rozhodnutím o tzv. statistickévýznamnosti (statistical significance) pozorovaného efektu (rozdílu parametrůdvou nebo více výběrových souborů, případně rozdílu parametru jednohosouboru od předem dané konstantní hodnoty).

Statisticke testy jsou konstruované tak, aby s rostoucím rozsahem výběrureagovaly na jakékoliv odchylky citlivěji. Tj. čím větší rozsah výběru, tím menšípozorovaný efekt je posouzen jako statisticky významný.

Statistická významnost nemusí znamenat existenci příčinného vztahu, statistickávýznamnost pouze indikuje, že pozorovaný efekt není ve smyslu stanovenéhypotézy náhodný.

Jako míry praktické (věcné, klinické, biologické) významnosti pozorovanýchefektů se používají tzv. ukazatelé míry účinků (effect size). Těmito ukazatelijsou libovolné statistiky, které

odrážejí míru porušení nulové hypotézy,nezávisí na rozsahu výběru,nejsou ovlivněny volbou jednotky proměnných.

Pravděpodobnost a statistika

Page 27: Pravdepodobnost a statistika - vsb.cz

Vybrané jednovýběrové testy hypotéz

test o rozptylu,

testy o střední hodnotě (z-test, t-test),

Kvantilový test (neparametrický test)

Wilcoxonův test (neparametrický test střední hodnoty)

testy o parametru binomického rozdělení,

Pravděpodobnost a statistika

Page 28: Pravdepodobnost a statistika - vsb.cz

Test o rozptylu normálního rozdělení

H0 : σ2 = σ20HA : σ2 6= σ20 (resp. σ2 < σ20 , σ

2 > σ20)

Předpoklady testu:X je náhodný výběr z populace mající normální rozdělení s neznámou střední hodnotou.Testová statistika:

χ2 =

s2

σ20(n − 1)

Nulové rozdělení:χ2 rozdělení s n − 1 stupni volnosti

Pravidla pro zamítnutí H0 pro podle zvolené alternativní hypotézy:HA : σ2 6= σ20 . . . zamítáme H0, když χ2 < χ2

α2

(n − 1) nebo χ2 > χ21−α

2(n − 1)

HA : σ2 > σ20 . . . zamítáme H0, když . . . χ2 > χ21−α(n − 1)

HA : σ2 < σ20 . . . zamítáme H0, když . . . χ2 < χ2α(n − 1)

Pravděpodobnost a statistika

Page 29: Pravdepodobnost a statistika - vsb.cz

Test o střední hodnotě (z-test pro jeden výběr)H0 : µ = µ0HA : µ 6= µ0 (resp. µ < µ0, µ > µ0)

tzn. testujeme hypotézu, zda data náhodného výběru pochází z rozdělení se stejnou střední hodnotou, jakoje předpokládaná konstanta µ0.Předpoklady testu:X je náhodný výběr z populace mající normální rozdělení o známém rozptylu σ2.Testová statistika:

T (X) =X − µ0σ

√n ∼ N(0, 1)

Nulové rozdělení:normované normální rozděleníPravidla pro zamítnutí H0 pro z-test pro jeden výběr podle zvolené alternativní hypotézy:

HA : µ 6= µ0 . . . zamítáme H0, když . . . |Z | > z1−α2

HA : µ > µ0 . . . zamítáme H0, když . . . Z > z1−α

HA : µ < µ0 . . . zamítáme H0, když . . . Z < zα

Pravděpodobnost a statistika

Page 30: Pravdepodobnost a statistika - vsb.cz

Test o střední hodnotě (t-test pro jeden výběr)H0 : µ = µ0HA : µ 6= µ0 (resp. µ < µ0, µ > µ0)

tzn. testujeme hypotézu, zda data náhodného výběru pochází z rozdělení se stejnou střední hodnotou, jakoje předpokládaná konstanta µ0.Předpoklady testu:X je náhodný výběr z populace mající normální rozdělení s neznámým rozptylem σ2 (tj. nepředpokládámeznalost parametru σ).Testová statistika:

T (X) =X − µ0

s√

n ∼ t(n − 1)

Nulové rozdělení:Studentovo rozdělení s n − 1 stupni volnosti.

Pravidla pro zamítnutí H0 pro t-test pro jeden výběr podle zvolené alternativní hypotézy:HA : µ 6= µ0 . . . zamítáme H0, když . . . |T | > t1−α

2(n − 1)

HA : µ > µ0 . . . zamítáme H0, když . . .T > t1−α(n − 1)HA : µ < µ0 . . . zamítáme H0, když . . .T < tα(n − 1)

Pravděpodobnost a statistika

Page 31: Pravdepodobnost a statistika - vsb.cz

Jak postupovat pokud není splněn předpoklad normality?

1) Původní veličinu transformujeme (např. pomocí logaritmu, druhéodmocniny či převrácené hodnoty) na novou veličinu, pro kterou jemodel normálního rozdělení přijatelný.

2) Požadovanou analýzu potom provedeme na transformované veličině.

3) Výsledky analýzy (např. průměry či intervaly spolehlivosti) lze proúčely prezentace výsledků zpětně transformovat.Pokud nenajdeme vhodnou transformaci na normální rozdělení,nabízí statistika jiné přístupy založené např. na tzv.

neparametrických (robustních) metodách.

Neparametrické testy – testy, které nemají předpoklady ohledně typurozdělení populace (Mají nižší sílu testu než jejich parametrickéalternativy)

Pravděpodobnost a statistika

Page 32: Pravdepodobnost a statistika - vsb.cz

Kvantilový test (neparametrický test)- umožňuje na základě výběru X1, X2, . . . , Xn ověřit předpoklad, že se 100p% kvantil xp rovná určité hodnotě xp0 .- pozn.: Používáme jej zejména jako mediánový test v případech, kdy chceme testovat střední hodnotu populace,která má výrazně zešikmené rozdělení. Jelikož tento test má malou sílu(pravděpodobnost chyby II. druhu je velkáve srovnání s jinými testy), je vhodné mít k dispozici výběr o větším rozsahu.

H0 : xp = xp0HA : xp 6= xp0 (resp. xp < xp0 , xp > xp0 )

Testová statistika:T (X) = Y ,

kde náhodná veličina Y modeluje počet pozorování v náhodném výběru, u kterých je pozorovaná hodnotanáhodné veličiny X menší než testována hodnota xp0 , tj. x < xp0 .

Nulové rozdělení:Platí-li nulová hypotéza, pak pravděpodobnost, že nějaké pozorování bude menší než xp0 je p. Početpozorování v náhodném výběru, která jsou menší než xp0 , má proto, za předpokladu platnosti nulovéhypotézy, binomické rozdělení Bi(n; p).

Poznámka: V případě, že testujeme medián, tzn. pro p = 0.5, používáme pro tento test označení mediánový test.Ten je alternativou jednovýběrového t testu v situaci, kdy nelze předpokládat normální rozdělení populace. Vpřípadě, že hodnoty analyzované náhodné veličiny X jsou rozdíly párových pozorování,užíváme pro mediánový testnázev znaménkový test.

Pravděpodobnost a statistika

Page 33: Pravdepodobnost a statistika - vsb.cz

Wilcoxonův test (neparametrický test střední hodnoty)H0: x0.5 = x0.50HA: x0.5 6= x0.50 (resp. x0.5 < x0.50 , x0.5 > x0.50 )

Předpoklady testu:Mějme náhodný výběr X1, . . . , Xn ze spojitého rozdělení s hustotou f , která je symetrická kolem bodu a(tzn. a je median x0.5).

Postup: Je-li některá z veličin X1, X2, . . . , Xn rovna testované hodnotě x0.50 , obvykle toto pozorování zvýběrového souboru vypustíme. Položme Yi = Xi − x0.50 , i = 1, 2, . . . , n. Veličiny Yi seřaďme vzestupněpodle jejich absolutní hodnot

|Y(1)| ≤ |Y(2)| ≤ · · · ≤ |Y(n)|

Označme Ri pořadí veličiny |Y(i)|. Dále

S+ =∑Yi ≥0

Ri , S− =∑Yi<0

Ri .

Testová statistika:

T (X) = min(S+; S−) . . . pro oboustranou alternativu,

= S+. . . pro levostranou alternativu,

= S−. . . pro pravostrannou alternativu.

Pravidlo pro zamítnutí H0:H0 zamítáme na hladině významnosti α, když T ≤ ωnα.

Pravděpodobnost a statistika

Page 34: Pravdepodobnost a statistika - vsb.cz

Kritické hodnoty jednovýběrového Wilcoxonova testu (ωnα)

Pravděpodobnost a statistika

Page 35: Pravdepodobnost a statistika - vsb.cz

Příklad:

U 12 náhodně vybraných zemí bylo zjištěno procento populace starší 60 let:4.9 6.0 6.9 17.6 4.5 12.3 5.7 5.3 9.6 13.5 15.7 7.7Na hladině významnosti 0.05 testujte hypotézu, že medián procenta populace starší 60let je 12 proti oboustranné alternativě.

Řešení:H0 : x0.5 = 12HA : x0.5 6= 12Vypočteme rozdíly pozorovaných hodnot od čísla 12, tj. xi − 12:−7.1 −6.0 −5.1 5.6 −7.5 0.3 −6.3 −6.7 −2.4 1.5 3.7 −4.3Absolutní hodnoty těchto rozdílů uspořádáme vzestupně podle velikosti. Kladné rozdílypřitom označíme modře:

usp. |xi − 12| 0.3 1.5 2.4 3.7 4.3 5.1 5.6 6 6.3 6.7 7.1 7.5pořadí R 1 2 3 4 5 6 7 8 9 10 11 12

S+ = 1 + 2 + 4 + 7 = 14,S− = 3 + 5 + 6 + 8 + 9 + 10 + 11 + 12 = 64,n = 12, α = 0, 05 =⇒ tabelovaná kritická hodnota je 13,Testová statistika: T (X) = min(S+, S−) = min(14, 64) = 14.Protože 14 > 13, H0 nezamítáme na hladině významnosti 0.05. Znamená to, že nahladině významnosti 0.05 se nepodařilo prokázat, že aspoň v polovině zemí by se podílpopulace nad 60 let odlišoval od 12%.

Pravděpodobnost a statistika

Page 36: Pravdepodobnost a statistika - vsb.cz

Asymptotická varianta jednovýběrového Wilcoxonova testu:Máme-li k dispozici výběr o dostatečně velkém rozsahu (n > 30), využijeme toho, že S+ má asymptotickynormální rozdělení s parametry

E(S+) =14

n(n + 1), D(S+) =124

n(n + 1)(2n + 1) .

Testové kritérium:

T (X) =S+ − E(S+)√

D(S+)∼ N(0, 1)

Nulové rozdělení:normované normální rozdělení

Kriticky obor:pro oboustrannou alternativu W =

(−∞,−z1−α

2

⟩∪⟨

z1−α2,∞),

pro levostrannou alternativu W =(−∞,−z1−α

⟩,

pro pravostrannou alternativu W =⟨

z1−α,∞).

Pravidlo pro zamítnutí H0:H0 zamítáme na asymptotické hladině významnosti α, když T ∈ W .

Poznámka: K zamítnutí H0 tak může dojít i tehdy je-li median roven x0.50 , ale hustota f je výrazně asymetrická.

Pravděpodobnost a statistika

Page 37: Pravdepodobnost a statistika - vsb.cz

Příklad

30 náhodně vybraných osob mělo nezávisle na sobě bez předchozího nácviku odhadnout, kdy od daného signáluuplyne právě 1 minuta. Byly získány následující výsledky (v sekundách): 53 48 45 55 63 51 66 56 50 58 61 51 6463 59 47 46 58 52 56 61 57 48 62 54 49 51 46 53 58.Na asymptotické hladině významnosti 0.05 testujte hypotézu, že medián rozložení, z něhož daný náhodný výběrpochází, je 60 sekund proti oboustranné alternativě (nulová hypotéza vlastně tvrdí, že polovina osob délku jednéminuty podhodnotí a druhá nadhodnotí).

Řešení:Testujeme H0: x0.5 = 60 proti oboustranné alternativě H1: x0.5 6= 60.Stanovíme statistiku S+ = 55.Asymptotická testová statistika:

T =S+ − E(S)+√

D(S+)=

S+ − n(n+1)4√

n(n+1)(2n+1)24

=55− 30(30+1

4√30(30+1)(2·30+1)

24

= −3.65

Kritický obor:

W =(−∞,−z1−α

2

⟩∪⟨

z1−α2,∞)

= (−∞,−z0.975〉 ∪ 〈z0.975,∞) = (−∞,−1.96〉 ∪ 〈1.96,∞)

Testová statistika se realizuje v kritickém oboru, tedy H0 zamítáme na asymptotické hladině významnosti 0.05. Srizikem omylu nejvýše 5 % jsme tedy prokázali, že pravděpodobnost nadhodnocení jedné minuty není stejná jakopravděpodobnost podhodnocení.

Pravděpodobnost a statistika

Page 38: Pravdepodobnost a statistika - vsb.cz

Párový Wilcoxonův test (nerametrická obdoba párovéhot-testu)

Nechť (X1,Y1), . . . , (Xn,Yn) je náhodný výběr ze spojitéhodvourozměrného rozložení.

Testujeme H0: x0.5 − y0.5 = c proti H1: x0.5 − y0.5 6= c (resp. protijednostranným alternativám).

Utvoříme rozdíly Zi = Xi − Yi , i = 1, . . . , n a testujeme hypotézu omediánu z0.5, tj. H0: z0.5 = c proti H1: z0.5 6= c.

Pravděpodobnost a statistika

Page 39: Pravdepodobnost a statistika - vsb.cz

Příklad:K zjištění cenových rozdílů mezi určitými dvěma druhy zboží bylo náhodně vybráno 15 prodejen a byly zjištěny cenyzboží A a ceny zboží B: (11, 10), (14, 11), (11, 9), (13, 9), (11, 9), (10, 9), (12, 10), (10, 8), (12, 11), (11, 9),(13, 10), (14, 10), (14, 12), (19, 15), (14, 12). Na hladině významnosti 0.05 je třeba testovat hypotézu, že mediáncenových rozdílů činí 3 Kč.

Řešení:Testujeme H0: z0.5 = 3 proti oboustranné alternativě H1: z0.5 6= 3, kde z0.5 je medián rozložení, z něhož pocházírozdílový náhodný výběr Zi = Xi − Yi . Vypočteme rozdíly mezi cenou zboží A a cenou zboží B, čímž úlohupřevedeme na jednovýběrový test. Výpočty uspořádáme do tabulky:

č. prodejny cena zboží A cena zboží B zi zi − 3 |zi − 3| pořadí1 11 10 1 −2 2 122 14 11 3 0 0 −3 11 9 2 −1 1 5.54 13 9 4 1 1 5.55 11 9 2 −1 1 5.56 10 9 1 −2 2 127 12 10 2 −1 1 5.58 10 8 2 −1 1 5.59 12 11 1 −2 2 1210 11 9 2 −1 1 5.511 13 10 3 0 0 −12 14 10 4 1 1 5.513 14 12 2 −1 1 5.514 19 15 4 1 1 5.515 14 12 2 −1 1 5.5

S+ = 5, 5 + 5, 5 + 5, 5 = 16.5,S− = 12 + 5, 5 + 5, 5 + 12 + 5, 5 + 5, 5 + 12 + 5, 5 + 5, 5 + 5, 5 = 74.5,n = 13, α = 0.05 =⇒ tabelovaná kritická hodnota = 17,testová statistika = min(S+, S−) = min(16.5; 74.5) = 16.5.Protože 16.5 ≤ 17, H0 zamítáme na hladině významnosti 0.05.

Pravděpodobnost a statistika

Page 40: Pravdepodobnost a statistika - vsb.cz

Dvouvýběrový Wilcoxonův test a jeho asymptotickávarianta (neparametrická obdoba dvouvýběrového t-testu)

Nechť X1, . . . ,Xn a Y1, . . . ,Ym jsou dva nezávislé náhodné výběry ze dvouspojitých rozložení, jejichž distribuční funkce se mohou lišit pouze posunutím.Označme x0.5 medián prvního rozdělení a y0.5 medián druhého rozdělení. Nahladině významnosti 0.05 testujeme hypotézu, že distribuční funkce těchtorozložení jsou shodné neboli mediány jsou shodné proti alternativě, že jsourozdílné, tj. H0: x0.5 − y0.5 = 0 proti H1: x0.5 − y0.5 6= 0.

Postup provedení testu:1) Všech n + m hodnot X1, . . . ,Xn a Y1, . . . ,Ym uspořádáme vzestupně

podle velikosti.2) Zjistíme součet pořadí hodnot X1, . . . ,Xn a označíme ho T1. Součet

pořadí hodnot Y1, . . . ,Ym označíme T2.3) Vypočteme statistiky

U1 = mn + n(n + 1)/2˘T1,U2 = mn + m(m + 1)/2− T2.Přitom platí U1 + U2 = mn.

4) Pokud min(U1,U2) ≤ tabelovaná kritická hodnota (pro dané rozsahyvýběrů m, n a dané α), pak nulovou hypotézu o totožnosti oboudistribučních funkcí zamítáme na hladině významnosti α.V tabulkách: n = min m, n a m = max m, n.

Pravděpodobnost a statistika

Page 41: Pravdepodobnost a statistika - vsb.cz

Asymptotická varianta dvouvýběrového Wilcoxonova testu

Pro velká n, m (n,m > 30) lze využít asymptotické normality statistiky U1.Platí-li H0, pak

U0 =U1 − mn

2√mn(m+n+1)

12

∼ N(0, 1) ,

kde U1 = min(U1,U2).

Kritický obor:pro oboustrannou alternativu W =

(−∞,−z1−α2

⟩∪⟨z1−α2 ,∞

),

pro levostrannou alternativu W = (−∞,−z1−α〉,pro pravostrannou alternativu W = 〈z1−α,∞).

H0 zamítáme na asymptotické hladině významnosti α, když U0 ∈W .

Předpoklady použití dvouvýběrového Wilcoxonova testu:- dané dva náhodné výběry jsou nezávislé,- rozdělení, z nichž dané dva náhodné výběry pocházejí, jsou spojitá,- distribuční funkce těchto rozložení se mohou lišit pouze posunutím,- sledovaná veličina má aspoň ordinální charakter.

Pravděpodobnost a statistika

Page 42: Pravdepodobnost a statistika - vsb.cz

Příklad

Bylo vybráno 10 polí stejné kvality. Na čtyřech z nich se zkoušel nový způsob hnojení,zbylých šest bylo ošetřeno starým způsobem. Pole byla oseta pšenicí a sledoval se jejíhektarový výnos. Je třeba zjistit, zda nový způsob hnojení má týž vliv na průměrnéhektarové výnosy pšenice jako starý způsob hnojení.hektarové výnosy při novém způsobu: 51 52 49 55hektarové výnosy při starém způsobu: 45 54 48 44 53 50Test proveďte na hladině významnosti 0.05.

Řešení:Na hladině významnosti 0.05 testujeme H0: x0.5 − y0.5 = 0 proti oboustrannéalternativě H1: x0.5 − y0.5 6= 0.

uspořádané hodnoty 44 45 48 49 50 51 52 53 54 55pořadí x-ových hodnot 4 6 7 10pořadí y -ových hodnot 1 2 3 5 8 9

T1 = 4 + 6 + 7 + 10 = 27, T2 = 1 + 2 + 3 + 5 + 8 + 9 = 28U1 = 4.6 + 4.5/2− 27 = 7, U2 = 4.6 + 6.7/2− 28 = 17Kritická hodnota pro α = 0.05, min(4, 6) = 4, max(4, 6) = 6 je 2.Protože min(7, 17) = 7 > 2, nemůžeme na hladině významnosti 0.05 zamítnouthypotézu, že nový způsob hnojení má na hektarové výnosy pšenice stejný vliv jakostarý způsob.

Pravděpodobnost a statistika

Page 43: Pravdepodobnost a statistika - vsb.cz

Test o parametru binomického rozděleníH0 : π = π0HA : π 6= π0 (resp. π < π0, π > π0)

Předpoklady testu:X je náhodný výběr z alternativního rozdělení. Rozsah rozdělení n musí splňovatpodmínky n > 30, n > 9

p(1−p) , kde p je relativní četnost výskytu sledovanéhojevu.

Testová statistika:

T (X) =p − π√π(1− π)

√n

Nulové rozdělení:normované normální rozdělení

Pravděpodobnost a statistika

Page 44: Pravdepodobnost a statistika - vsb.cz

Příklad

Podnik předpokládá, že o jeho nový výrobek bude mít zájem 70 % oslovených domácností. Proběhl předběžnýprůzkum, v němž bylo osloveno 400 náhodně vybraných domácností, z nichž o nový výrobek projevilo zájem 267.Určete na 5% hladině významnosti, zda je vyslovený předpoklad podniku správný.

Řešení:n = 400 (pozn.: požadavek na minimální rozsah výběru je splněn)p = 267

400 = 0.67α = 0.05

H0: π = 0.7HA: π 6= 0.7Alternativní hypotéza bude oboustranná, neboť zde není úkolem prokázat, že by podíl zájemců o výrobekměl být vyšší než 70 % nebo nižší.

W =(−∞,−z1−α

⟩T =

p − π√π · (1− π)

√n =

0.67− 0.7√0.7 · 0.3

√400 = −1.31

U ∈ V , tj. nezamítáme H0, nepřijímáme H1.

Na hladině významnosti 5 % jsme neprokázali, že by předpoklad o zájmu o nový výrobek, vyslovenýpodnikem, nebyl správný.

Pravděpodobnost a statistika

Page 45: Pravdepodobnost a statistika - vsb.cz

Některé testy v RJedno a dvouvýběrový test o střední hodnotě (t-test):

t.test(x, mu = číslo, alternative = "hodnota "))

Jednovýběrový Wilcoxonův test:wilcox.test(x, mu = x0.50 , alternative = "hodnota ")

Test o parametru binomického rozdělení:binom.test(x, n, p = π0, alternative = "hodnota ")

párový t-test, resp.mnohonásobné porovnávánípairwise.t.test

porovnání dvou rozptylů pro normálně rozdělená data (F test)var.test

testo korelačním koeficientu pro normálně rozdělená datacor.test

Kruskalův-Wallisův test(neparametrická jednoduchá ANOVA)kruskal.test

Friedmanova neparametrická ANOVA s dvěma faktoryfriedman.test

test o nulovosti Kendallova τcor.test(method="kendall")

test o nulovosti Spearmanova ρcor.test(method="spearman")

test porovnávající pravděpodobnosti úspěchu (proportions)ve dvou výběrechprop.test

test pro trend v pravděpodobnostech úspěchu prop.trend.test

Fisherův exaktní faktoriálový test v malých kontingenčních tabulkáchfisher.test

χ2 test nezislosti v kontingenční tabulcechisq.test

logistická regreseglm(y ∼ x1 + x2 + x3, binomial)

poissonovská regrese (log-lineární model)glm(count ∼ f1 + f2 + f3, poisson)

hodnota atributu alternative: less, two.sided, greater

Pravděpodobnost a statistika

Page 46: Pravdepodobnost a statistika - vsb.cz

Vtip

Biolog, Statistik, Matematik a Informatik na safari.

Zastaví džíp a pozorují dalekohledem zebry.Biolog: „Podívejte se! Stádo zeber! A mezi nimi bílá zebra! To jefantastické! Existují bílé zebry! Budeme slavní!“Statistik: „To není významné. Platí pouze, že hypotézu, že bílé zebryneexistují nemůžeme zamítnout!“Matematik: „Ve skutečnosti víme, že existuje zebra, která je na jednéstraně bílá.“Informatik: „Ale kdepak! To je výjimka!“

Pravděpodobnost a statistika

Page 47: Pravdepodobnost a statistika - vsb.cz

Děkuji za pozornost !!!

Pravděpodobnost a statistika