54
Biostatisztika Hipotézisvizsgálatok, egy- és kétoldalas próbák, statisztikai hibák, ANOVA Dr. Boda Krisztina PhD SZTE ÁOK Orvosi Fizikai és Orvosi Informatikai Intézet

egy- és kétoldalas próbák, statisztikai hibák, ANOVA · A statisztika elméletének fontos része olyan döntési szabályok keresése, amely a próbát a lehető legerősebbé

  • Upload
    others

  • View
    3

  • Download
    0

Embed Size (px)

Citation preview

Page 1: egy- és kétoldalas próbák, statisztikai hibák, ANOVA · A statisztika elméletének fontos része olyan döntési szabályok keresése, amely a próbát a lehető legerősebbé

Biostatisztika

Hipotézisvizsgálatok,

egy- és kétoldalas próbák,

statisztikai hibák, ANOVA

Dr. Boda Krisztina PhD

SZTE ÁOK Orvosi Fizikai és Orvosi

Informatikai Intézet

Page 2: egy- és kétoldalas próbák, statisztikai hibák, ANOVA · A statisztika elméletének fontos része olyan döntési szabályok keresése, amely a próbát a lehető legerősebbé

Krisztina Boda 2

Hipotézisvizsgálatok

A hipotézisvizsgálat során a rendelkezésre

álló adatok (statisztikai minta) alapján az

egész jelenség (populáció) tulajdonságaira

következtetünk.

Azt vizsgáljuk, hogy a tapasztalt eredmény

(különbség) nagyobb-e, mint amit a véletlen

önmagában okoz.

Page 3: egy- és kétoldalas próbák, statisztikai hibák, ANOVA · A statisztika elméletének fontos része olyan döntési szabályok keresése, amely a próbát a lehető legerősebbé

Krisztina Boda 3

Mintavétel, szimuláció

Legyen a populáció 120 átlagú, 10

szórású normális eloszlás, ebből veszünk

50 elemű mintákat

Page 4: egy- és kétoldalas próbák, statisztikai hibák, ANOVA · A statisztika elméletének fontos része olyan döntési szabályok keresése, amely a próbát a lehető legerősebbé

Krisztina Boda 4

Histogram: s2

K-S d=.08901, p> .20; Lilliefors p> .20

Expected Normal

80 90 100 110 120 130 140 150 160

X <= Category Boundary

0

5

10

15

20

25

No. o

f obs.

Page 5: egy- és kétoldalas próbák, statisztikai hibák, ANOVA · A statisztika elméletének fontos része olyan döntési szabályok keresése, amely a próbát a lehető legerősebbé

Krisztina Boda 5

Histogram: s3

K-S d=.06554, p> .20; Lilliefors p> .20

Expected Normal

80 90 100 110 120 130 140 150 160

X <= Category Boundary

0

2

4

6

8

10

12

14

16

18

20

No. o

f obs.

Page 6: egy- és kétoldalas próbák, statisztikai hibák, ANOVA · A statisztika elméletének fontos része olyan döntési szabályok keresése, amely a próbát a lehető legerősebbé

Krisztina Boda 6

Histogram: s4

K-S d=.05667, p> .20; Lilliefors p> .20

Expected Normal

80 90 100 110 120 130 140 150 160

X <= Category Boundary

0

5

10

15

20

25

No. o

f obs.

Page 7: egy- és kétoldalas próbák, statisztikai hibák, ANOVA · A statisztika elméletének fontos része olyan döntési szabályok keresése, amely a próbát a lehető legerősebbé

Krisztina Boda 7

Histogram: s5

K-S d=.06256, p> .20; Lilliefors p> .20

Expected Normal

80 90 100 110 120 130 140 150 160

X <= Category Boundary

0

2

4

6

8

10

12

14

16

18

20

No. o

f obs.

Page 8: egy- és kétoldalas próbák, statisztikai hibák, ANOVA · A statisztika elméletének fontos része olyan döntési szabályok keresése, amely a próbát a lehető legerősebbé

Krisztina Boda 8

Histogram: s6

K-S d=.11902, p> .20; Lilliefors p<.10

Expected Normal

80 90 100 110 120 130 140 150 160

X <= Category Boundary

0

2

4

6

8

10

12

14

16

18

20

22

No. o

f obs.

Page 9: egy- és kétoldalas próbák, statisztikai hibák, ANOVA · A statisztika elméletének fontos része olyan döntési szabályok keresése, amely a próbát a lehető legerősebbé

Krisztina Boda 9

Histogram: s7

K-S d=.07360, p> .20; Lilliefors p> .20

Expected Normal

80 90 100 110 120 130 140 150 160

X <= Category Boundary

0

5

10

15

20

25

No. o

f obs.

Page 10: egy- és kétoldalas próbák, statisztikai hibák, ANOVA · A statisztika elméletének fontos része olyan döntési szabályok keresése, amely a próbát a lehető legerősebbé

Krisztina Boda 10

120 átlagú, 10 szórású populációból származó 50

elemű minták átlagai és szórásai

0

20

40

60

80

100

120

140

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

ismétlés

átl

ag

+ S

D

Page 11: egy- és kétoldalas próbák, statisztikai hibák, ANOVA · A statisztika elméletének fontos része olyan döntési szabályok keresése, amely a próbát a lehető legerősebbé

Krisztina Boda 11

Mekkora lehet a véletlen ingadozás?

A minták átlagai 120 körül ingadoznak, ha

„nem történik semmi”, csak sima ismétlés

Két mérés különbségének átlaga a 0 körül

ingadozik

Mekkora az a különbség, amit már nem a

véletlen okoz?

Page 12: egy- és kétoldalas próbák, statisztikai hibák, ANOVA · A statisztika elméletének fontos része olyan döntési szabályok keresése, amely a próbát a lehető legerősebbé

Krisztina Boda 12

Hipotézisek

Nullhipotézis: véletlen

ingadozást mértem,

„semmi nem történt”.

A különbség 0 körül

ingadozik

Alternatív hipotézis: a

véletlen ingadozásnál

nagyobbat mértem,

„valami történt”

A különbség 0-tól eltérő

szám körül ingadozik

???

y=student(x;49)

-3 -2 -1 0 1 2 3

0.0

0.1

0.2

0.3

0.4

0.5

p=2*(1-istudent(abs(x);49))

-3 -2 -1 0 1 2 3

0.0

0.2

0.4

0.6

0.8

1.0

0

Page 13: egy- és kétoldalas próbák, statisztikai hibák, ANOVA · A statisztika elméletének fontos része olyan döntési szabályok keresése, amely a próbát a lehető legerősebbé

Krisztina Boda 13

Hipotézisek tesztelése

Mekkora esélyt adjunk a véletlennek?

(Megbízhatósági szint).

Akármennyi lehet, (tőlünk függ), általában 95%

Mekkora esélyt adjunk annak, hogy esetleg

hibásan döntünk (szignifikancia szint)

Általában 5% (=0.05)

Page 14: egy- és kétoldalas próbák, statisztikai hibák, ANOVA · A statisztika elméletének fontos része olyan döntési szabályok keresése, amely a próbát a lehető legerősebbé

Krisztina Boda 14

A hipotézisvizsgálat menete

Hipotézisek felállítása Nullhipotézis: semmi nem történt

Alternatív hipotézis: valami változás van

A döntés megbízhatósága (vagy a hiba) rögzítése: =0.05

Döntési szabály felállítása (függ: a kísérleti elrendezéstől, -tól, az elemszámtól)

Minta-elemszám meghatározása

A minta előállítása (mérés, adatgyűjtés,stb)

A döntési szabály kiszámítása

Döntés A nullhipotézist elfogadjuk (nincs szignifikáns különbség szinten,

nincs elegendő információ a különbség (hatás) kimutatására)

A nullhipotézist elvetjük, a különbség szignifikáns %-os szinten. A tapasztalt különbség nem csupán a véletlen műve, valami más hatás (kezelés??) is közbejátszott.

Page 15: egy- és kétoldalas próbák, statisztikai hibák, ANOVA · A statisztika elméletének fontos része olyan döntési szabályok keresése, amely a próbát a lehető legerősebbé

Krisztina Boda 15

Student féle t-próbák

Általános cél. A Student t-próbák normális eloszlású populációk átlagait vizsgálják. A hipotézisek teszteléséhez egy t próbastatisztikát használnak, amely a nullhipotézis fennállása esetén adott szabadságfokú t-eloszlást követ.

Egymintás t-próba. Adott egyetlen minta, amelyről feltesszük, hogy normális eloszlásból származik. A próbával azt teszteljük, hogy a populáció-átlag lehet-e egy adott konstans H0: =c

Páros t-próba (= egymintás t-próba a különbségekre). Két összetartozó mintát vizsgál. Feltételezzük, hogy a különbség-minta normális eloszlásból származik. A próbával azt teszteljük, hogy a különbség-átlag a populációban lehet-e nulla H0: különbség=0

Kétmintás t-próba ( independent samples t-test). Két független mintánk van, mindegyikről feltétezzük, hogy normális eloszlású populációból származik. A próbával azt teszteljük, hogy a két populáció-átlag azonos-e H0: 1= 2

Page 16: egy- és kétoldalas próbák, statisztikai hibák, ANOVA · A statisztika elméletének fontos része olyan döntési szabályok keresése, amely a próbát a lehető legerősebbé

Krisztina Boda 16

Normális eloszlást feltételezve,

az átlagok összehasonlítására használható próbák

Egy minta esete: egymintás t-próba

Két minta esete: Összetartozó minták: (előtt-után, baloldal-jobboldal):

páros t-próba= egymintás t-próba a különbségekre

Független minták (placebo-kezelés, férfi-nő, beteg-egészséges): kétmintás t-próba Azonos szórások esetén „klasszikus”

Különböző szórások esetén „módosított” (Welch, D)

Szórások egyezésének tesztelése: F-próba, Levene-próba

Több (>2) minta esete: varianciaanalízis

3. Egyváltozós statisztikák

Page 17: egy- és kétoldalas próbák, statisztikai hibák, ANOVA · A statisztika elméletének fontos része olyan döntési szabályok keresése, amely a próbát a lehető legerősebbé

Krisztina Boda

t-próbák végrehajtásának általános menete

Null- és alternatív hipotézis felállítása

Rögzítjük -t

Ellenőrizzük a feltételeket legalább grafikusan

Normalitásvizsgálat, kétmintás t-próba esetén a varianciák azonossága

– a hisztogramok illetve boksz diagramok alapján

A próbastatisztika kiszámítása – általában egy formula

Döntés táblabeli t-érték (ttáblázat ) alapján döntés( kézi számolás)

|t|>ttáblázat - elvetjük H0-t (elfogadjuk Ha-t) és azt mondjuk, hogy a

különbség szignifikáns szinten

|t|<ttáblázat – nem vetjük el H0-t (elfogadjuk) és azt mondjuk, hogy a

különbség nem szignifikáns szinten

Döntés p-érték alapján (számítógép)

p< - elvetjük H0-t (elfogadjuk Ha-t) és azt mondjuk, hogy a különbség

szignifikáns szinten

p> - nem vetjük el H0-t (elfogadjuk) és azt mondjuk, hogy a különbség

nem szignifikáns szinten17

Page 18: egy- és kétoldalas próbák, statisztikai hibák, ANOVA · A statisztika elméletének fontos része olyan döntési szabályok keresése, amely a próbát a lehető legerősebbé

Statisztikai próbákról

általában

Page 19: egy- és kétoldalas próbák, statisztikai hibák, ANOVA · A statisztika elméletének fontos része olyan döntési szabályok keresése, amely a próbát a lehető legerősebbé

Krisztina Boda 19

Egy- és kétoldalas próbák

Kétoldalas próba

H0: nincs változás 1=2

Ha: van változás (bármilyen

irányú) 12

Egyoldalas próba

H0: az átlag nem csökkent,

1≤2

Ha: az átlag csökkent, 1>2

9 szabadságfokú t-eloszlás

0.025 0.05

Más lesz a táblabeli kritikus érték. pegyoldalas=pkétoldalas/2

Page 20: egy- és kétoldalas próbák, statisztikai hibák, ANOVA · A statisztika elméletének fontos része olyan döntési szabályok keresése, amely a próbát a lehető legerősebbé

Krisztina Boda 20

valószínűség

df 0.2 0.1 0.05 0.02 0.01 0.001

1 3.078 6.314 12.706 31.821 63.657 636.619

2 1.886 2.920 4.303 6.965 9.925 31.599

3 1.638 2.353 3.182 4.541 5.841 12.924

4 1.533 2.132 2.776 3.747 4.604 8.610

5 1.476 2.015 2.571 3.365 4.032 6.869

6 1.440 1.943 2.447 3.143 3.707 5.959

7 1.415 1.895 2.365 2.998 3.499 5.408

8 1.397 1.860 2.306 2.896 3.355 5.041

9 1.383 1.833 2.262 2.821 3.250 4.781

valószínűség

egyoldalas

0.1 0.05 0.025 0.01 0.005 0.0005

kétoldalas

df 0.2 0.1 0.05 0.02 0.01 0.001

1 3.078 6.314 12.706 31.821 63.657 636.619

2 1.886 2.920 4.303 6.965 9.925 31.599

3 1.638 2.353 3.182 4.541 5.841 12.924

4 1.533 2.132 2.776 3.747 4.604 8.610

5 1.476 2.015 2.571 3.365 4.032 6.869

6 1.440 1.943 2.447 3.143 3.707 5.959

7 1.415 1.895 2.365 2.998 3.499 5.408

Page 21: egy- és kétoldalas próbák, statisztikai hibák, ANOVA · A statisztika elméletének fontos része olyan döntési szabályok keresése, amely a próbát a lehető legerősebbé

Krisztina Boda 21

Szignifikancia

Szignifikáns a különbség – ha azt mondjuk, hogy van hatás, az esetleges hiba nagysága kicsi (maximum - ez az ún. első fajta hiba).

Nem szignifikáns különbség – ilyenkor csak annyit tudunk mondani, hogy nincs elegendő információ a különbség kimutatására. Lehet, hogy Valóban nincs is különbség

Van különbség, csak kevés volt az elemszám

Nagy volt a szórás

Rossz volt a vizsgálati módszer

A statisztikai szignifikanciát mindig át kell gondolni, vajon biológiai szempontból jelentős-e

Page 22: egy- és kétoldalas próbák, statisztikai hibák, ANOVA · A statisztika elméletének fontos része olyan döntési szabályok keresése, amely a próbát a lehető legerősebbé

Krisztina Boda 22

Statisztikai hibák Hipotézisvizsgálat során a minták alapján az összehasonlítandó

populációkról döntést hozunk: vagy azt állítjuk róluk, hogy különbözők, vagy azt, hogy azonosak. Bárhogyan döntünk is, nem tudhatjuk, hogy helyesen döntöttünk-e, mivel a valóságot nem ismerjük (a hipotézisvizsgálatot éppen ezért végezzük). Helyesen döntöttünk, ha különbséget állapítottunk meg és a populációk valóban eltérők, vagy ha nem állapítottunk meg különbséget, és a populációk valóban azonosak.

Döntés Igazság

HA igaz H0 igaz

Elvetjük H0-t helyes döntés első fajta hiba, Type I. error

(szign.) (álpozitív eredmény)

valószínűsége:

Nem vetjük el második fajta hiba, helyes döntés

H0-t Type II.error (álnegatív

(nem szign.) eredmény)

valószínűsége:

Page 23: egy- és kétoldalas próbák, statisztikai hibák, ANOVA · A statisztika elméletének fontos része olyan döntési szabályok keresése, amely a próbát a lehető legerősebbé

Krisztina Boda

A referencia teszt

Az általunk vizsgált (új) teszt eredménye

Pozitív (beteg) Negatív (nem beteg)

Pozitív VP – Valódi pozitív

(a)ÁP – Álpozitív

(b)Össz pozitív (a + b)

Negatív ÁN – Álnegatív

(c)

VN – Valódi negatív

(d)Össz negatív (c + d)

Összes beteg(a + c)

Összes nem beteg(b + d)

Összes eset (n=a+b+c+d)

Kereszt-osztályozás ̶ emlékeztető

Szenzitivitás= a/(a+c) ∙100% P(T+|B) = P(T+ B)/P(B)

Specificikusság= d/(b+d) ∙100% P(T-|E ) = P(T- E )/P(E )

Pozitív prediktív érték= a/(a+b) ∙100%

Negatív prediktív érték = d/(c+d) ∙100%

Validitás = (a+d)/(a+b+c+d) ∙100%

Álnegativitási arány= c/(a+c) ∙100% ;

Álpozitivitási arány= b(b+d) ∙100% ;

Page 24: egy- és kétoldalas próbák, statisztikai hibák, ANOVA · A statisztika elméletének fontos része olyan döntési szabályok keresése, amely a próbát a lehető legerősebbé

Krisztina Boda 24

Első fajta hiba, Type I. error

Előfordulhat, hogy szignifikáns különbséget állapítunk meg, pedig valójában nincs különbség. Ebben az esetben a döntés hibás, az elkövetett hibát első fajta hibának nevezik, nagyságát elkövetésének valószínűségével szokás megadni. Az első fajta hiba valószínűsége annak esélye, hogy a tapasztalt különbséget a véletlen okozta, ez éppen a szignifikanciaszinttel egyenlő (). Ha több összehasonlítást végzünk, pl. több csoportot páronként hasonlítunk össze, ez a hiba halmozódhat.

Page 25: egy- és kétoldalas próbák, statisztikai hibák, ANOVA · A statisztika elméletének fontos része olyan döntési szabályok keresése, amely a próbát a lehető legerősebbé

Krisztina Boda 25

Második fajta hiba, Type II.error

Hipotézisvizsgálat során nem állapítunk meg szignifikáns különbséget, pedig valójában – azaz a populációk között –mégis van különbség. Ebben az esetben a döntés hibás, az így elkövetett hibát második fajta hibának nevezik.

A második fajta hiba valószínűségét () általában nem ismerjük, mivel függ a szignifikanciaszinttől (),

az elemszámtól,

a populáció(k) szórásától

tényleges különbség (hatás) nagyságától

egyéb tényezők (milyen próba, a feltételek teljesülése, a kísérleti elrendezés, ..)

A második fajta hiba valószínűségének kiszámítását az nehezíti, hogy nem ismerjük a populációk közötti tényleges különbséget, így gyakran ehelyett a megfelelőnek tekintett különbséget (pl. a legkisebb klinikailag jelentős különbség), vagy a minták átlagai alapján becsült különbséget alkalmazzák. A populáció szórását pedig a minta(ák)ból számolt szórással közelítik.

Page 26: egy- és kétoldalas próbák, statisztikai hibák, ANOVA · A statisztika elméletének fontos része olyan döntési szabályok keresése, amely a próbát a lehető legerősebbé

Krisztina Boda 26

A próba ereje

A második fajta hiba valószínűsége helyett inkább (1–)-t, a próba erejét szokták megadni A próba ereje azt méri, hogy a próba milyen jó abban az esetben, ha elvetjük a hamis nullhipotézist. Minél erősebb a próba, (minél közelebb van értéke 1-hez), annál nagyobb valószínűséggel veti el a hamis nullhipotézist. Másképpen: a próba ereje annak valószínűsége, hogy egy különbséget — adott mintanagyság és szignifikancia-szint mellett — egy statisztikai próba kimutat. A vizsgálatok tervezésének gyakorlatában az erő nagyságának előre megszabott értékéből kiindulva határozzák meg a szükséges mintaelemszámot.

A statisztika elméletének fontos része olyan döntési szabályok keresése, amely a próbát a lehető legerősebbé teszi adott esetén.

Page 27: egy- és kétoldalas próbák, statisztikai hibák, ANOVA · A statisztika elméletének fontos része olyan döntési szabályok keresése, amely a próbát a lehető legerősebbé

Krisztina Boda 27

Második fajta hiba, Type II.error

„Ha a ködben semmit sem látsz, ez

távolról sem jelenti azt, hogy nincs ott

semmi”. (Piepenbrink kapitány – Hans-Peter Beck-Bernholdt,

Hans-Hermann Dubben: A tojást rakó kutya. Magyar

könyvklub, 1999.)

Page 28: egy- és kétoldalas próbák, statisztikai hibák, ANOVA · A statisztika elméletének fontos része olyan döntési szabályok keresése, amely a próbát a lehető legerősebbé

Krisztina Boda 28

Második fajta hiba, Type II.error

Page 29: egy- és kétoldalas próbák, statisztikai hibák, ANOVA · A statisztika elméletének fontos része olyan döntési szabályok keresése, amely a próbát a lehető legerősebbé

Krisztina Boda 29

A próba ereje adott elemszám és

esetén, különböző alternatív hipotézisek

mellett

Page 30: egy- és kétoldalas próbák, statisztikai hibák, ANOVA · A statisztika elméletének fontos része olyan döntési szabályok keresése, amely a próbát a lehető legerősebbé

Krisztina Boda 30

A próba ereje adott elemszám és

esetén, különböző alternatív hipotézisek

mellett

Page 31: egy- és kétoldalas próbák, statisztikai hibák, ANOVA · A statisztika elméletének fontos része olyan döntési szabályok keresése, amely a próbát a lehető legerősebbé

Krisztina Boda 31

Legyen a H0-ban és a H1-ben megfogalmazott átlag µ0 ill. µ1 .

Adott α,β, µ0 ill. µ1 esetén, konstans és ismert szórást tekintve a kritikus értékek a következők:

Kétoldalas α=0.05 esetén zα =1.96,

Egyoldalas β=0.1 esetén zβ =1.28.

Az egyenletekből az átlagot kifejezve és a két oldalt egyenlővé téve az n:

Két átlag (változás) összehasonlításához szükséges

elemszám ismert esetén

n

xz

0

n

xz

1

n

xz

0

2

01

)(

zzn

µ0 µ1

zα zβ

Page 32: egy- és kétoldalas próbák, statisztikai hibák, ANOVA · A statisztika elméletének fontos része olyan döntési szabályok keresése, amely a próbát a lehető legerősebbé

Krisztina Boda

Kérdések

Ha két mintaátlagát vizsgálom, milyen esetben (milyen kísérlet esetén) lehet páros t-próbát és milyen esetben lehet kétmintás t-próbát alkalmazni?

A kétmintás t-próba feltételei

A kétmintás t-próba nullhipotézise

A kétmintás t-próba végrehajtása azonos és különböző varianciák esetén

A varianciák összehasonlítása: F-próba

A statisztikai szignifikancia jelentése és értelmezése

Statisztikai hibák

Az első fajta hiba jelentése és valószínűsége

A második fajta hiba jelentése és valószínűsége. Mitől függ?

A próba ereje

Elemszámbecslés két átlag összehasonlításához (mitől függ?)

Page 33: egy- és kétoldalas próbák, statisztikai hibák, ANOVA · A statisztika elméletének fontos része olyan döntési szabályok keresése, amely a próbát a lehető legerősebbé

Krisztina Boda

Feladat A kalcium hatását vizsgálták a vérnyomásra két csoportban. A kezelés előtt és a kezelés után

mért különbségeket hasonlították össze kétmintás t-próbával. Értelmezze az alábbi eredményeket! Kimutatható-e 5%-os hibát feltételezve, hogy a kalcium kezelés csökkenti a vérnyomást?

Vérnyomás-esés alapstatisztikák

t-próba eredménye: különböző varianciákat feltételezve, t=1.604, szabadságfok=15.591, p=0.129-et kaptunk. (Útmutatás: elegendő a p-érték alapján dönteni, p>0.05, a különbség nem szignifikáns 5%-os szinten)

Group Statistics

10 5.0000 8.74325 2.76486

11 -.2727 5.90069 1.77913

treat

Calcium

Placebo

decr

N Mean Std. Dev iationStd. Error

Mean

Independent Samples Test

4.351 .051 1.634 19 .119 5.27273 3.22667 -1.48077 12.02622

1.604 15.591 .129 5.27273 3.28782 -1.71204 12.25749

Equal variances assumed

Equal variances notassumed

decr

F Sig.

Levene's Test f orEquality of Variances

t df Sig. (2-tailed)Mean

Dif f erenceStd. ErrorDif f erence Lower Upper

95% Conf idenceInterv al of the

Dif f erence

t-test for Equality of Means

Page 34: egy- és kétoldalas próbák, statisztikai hibák, ANOVA · A statisztika elméletének fontos része olyan döntési szabályok keresése, amely a próbát a lehető legerősebbé

Krisztina Boda

Feladatok1. Vajon azonos-e a diabeteses és nem diabeteses populáció átlag- cholesterin

szintje? Egy vizsgálatban az 1941-50 között születettek korcsoportjában a

következő eredményeket kapták:

Kontroll csoport n=63, átlag=5.27, SD=1.16

Diabetes csoport n=52, átlag=4.63, SD=1.31.

A kérdés eldöntésére milyen statisztikai próbát használ?

Mik a próba feltételei?

A próbastatisztika értéke t=2.327. Szignifikáns-e a különbség? Döntsön 5%-os

szinten (α =0.05)

A p-érték 0.022. Szignifikáns-e a különbség 5%-os szinten?

2. Vajon azonos-e a hallgatók populációjában a fiúk és lányok átlagéletkora? Az

idegen nyelvű képzésben szereplő hallgatók adatait elemezve, az átlagok

összehasonlítására a következő eredményeket kapták:

Fiú: n=4, átlag=21.18, SD=3.025

Lány: n=53, átlag=20.38, SD=3.108

A kérdés eldöntésére milyen statisztikai próbát használ?

Mik a próba feltételei?

A próbastatisztika értéke t=1.505. Szignifikáns-e a különbség? Döntsön 5%-os

szinten (α =0.05)

A p-érték 0.807. Szignifikáns-e a különbség 5%-os szinten?

34

Page 35: egy- és kétoldalas próbák, statisztikai hibák, ANOVA · A statisztika elméletének fontos része olyan döntési szabályok keresése, amely a próbát a lehető legerősebbé

Krisztina Boda

Problémák több próba végrehajtásakor

Page 36: egy- és kétoldalas próbák, statisztikai hibák, ANOVA · A statisztika elméletének fontos része olyan döntési szabályok keresése, amely a próbát a lehető legerősebbé

Krisztina Boda 36

Ugyanazon populációból származó minták

páronkénti összehasonlítása t-próbával

T-test for Dependent Samples: p-levels (veletlen)

Marked differences are significant at p < .05000

Variable s10 s11 s12 s13 s14 s15 s16 s17 s18 s19 s20

s1

s2

s3

s4

s5

s6

s7

s8

s9

0.3040790.0748480.7817330.1587250.2227190.1512340.2110680.0282620.6567540.0487890.223011

0.9438540.3269300.4451070.4500320.7992430.4684940.7328960.3510880.5898380.3124180.842927

0.3646990.1001370.8345800.1516180.3007730.1529770.2010400.1366360.7121070.0927880.348997

0.3350900.9125990.0695440.8118460.4909040.6467310.5213770.9945350.1728660.9772530.338436

0.4926170.1396550.9983070.2362340.4206370.1864810.3629480.1438860.8657910.1472450.399857

0.9048030.2852000.5921600.4298820.7745240.4941630.6747320.3927920.7078670.3301320.796021

0.1575640.8777970.0537520.6317880.3610120.5259930.3523910.7968600.0926150.8187090.263511

0.4622230.8589110.1567110.8788900.6241230.7894860.5698770.9320530.1360040.9235810.564532

0.4199120.0401890.8753610.1674410.3576680.1739770.2587940.0994880.7577670.0687990.371769

0

20

40

60

80

100

120

140

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

ismétlés

átl

ag

+ S

D

Page 37: egy- és kétoldalas próbák, statisztikai hibák, ANOVA · A statisztika elméletének fontos része olyan döntési szabályok keresése, amely a próbát a lehető legerősebbé

Krisztina Boda 37

Miért nem t-próbákat végzünk páronként?

Mert a véletlen is okozhat „szignifikáns eredményt

átlagosan minden 20-adik esetben.

CSOP R1 R2 R3 R4 R5 R6 R7 R8

1 . 0 0 - . 8 4 1 . 7 3 2 . 3 6 - . 3 0 - . 3 1 - . 3 1 - . 5 6 1 . 5 8

1 . 0 0 . 5 9 . 4 4 . 6 0 - . 7 5 - . 2 8 - 1 . 5 1 - . 8 1 - . 1 2

1 . 0 0 . 1 9 - . 7 3 - 1 . 0 4 1 . 2 7 . 6 9 - . 2 1 - . 5 2 - 1 . 3 4

1 . 0 0 - 1 . 0 5 . 8 8 1 . 2 7 1 . 0 5 - . 8 7 . 6 8 - . 1 7 - . 1 5

1 . 0 0 . 1 2 - . 7 5 - . 0 5 - 1 . 1 3 2 . 2 1 . 7 4 - . 9 0 - . 4 5

1 . 0 0 1 . 1 0 - . 2 0 - . 7 8 1 . 0 2 . 6 7 . 1 8 - . 5 2 - . 3 4

1 . 0 0 - . 1 9 - . 5 7 - . 4 1 2 . 2 5 - 1 . 2 6 - . 2 7 . 4 4 - 2 . 5 2

1 . 0 0 . 4 5 1 . 2 0 2 . 7 7 - . 1 7 - . 6 8 . 6 0 . 5 4 - . 3 7

1 . 0 0 - . 5 8 - . 0 1 . 6 0 1 . 6 6 2 . 1 4 2 . 3 1 - . 9 0 - 1 . 7 5

1 . 0 0 - . 3 9 . 9 3 - . 5 1 . 3 1 - . 6 0 - . 2 1 . 5 5 . 5 7

1 . 0 0 - . 2 3 - 1 . 2 1 - 1 . 0 8 . 0 2 . 3 1 - 1 . 2 8 1 . 2 0 1 . 6 2

1 . 0 0 . 8 7 . 9 7 - 1 . 0 4 . 6 0 - . 2 9 . 8 6 1 . 0 9 - . 6 8

2 . 0 0 . 4 2 - 1 . 1 8 - . 6 4 - . 0 8 1 . 1 0 . 3 9 - . 6 6 2 . 1 2

2 . 0 0 1 . 2 6 - 2 . 1 3 - 1 . 7 8 - . 6 0 - 1 . 2 5 - 1 . 1 0 . 1 9 - 1 . 5 4

2 . 0 0 - . 6 0 - . 8 3 - . 9 4 1 . 6 1 . 9 5 1 . 3 7 . 1 0 - . 9 7

2 . 0 0 - 1 . 7 5 . 6 3 . 1 6 . 2 4 - . 2 5 1 . 4 9 . 4 2 - 2 . 0 1

2 . 0 0 . 0 7 - . 3 3 - . 5 6 . 3 6 . 1 2 - . 4 8 . 7 8 - 1 . 2 9

2 . 0 0 . 1 5 . 8 5 . 1 0 - 2 . 0 7 . 1 8 2 . 1 4 1 . 7 1 . 6 2

2 . 0 0 . 9 8 - 1 . 2 0 - . 4 6 - . 9 2 . 0 8 - 1 . 3 7 . 8 0 - . 6 7

2 . 0 0 - . 4 2 1 . 0 5 - . 2 9 . 7 3 . 1 0 1 . 4 2 . 7 9 1 . 6 7

2 . 0 0 2 . 0 0 . 0 6 2 . 2 4 - . 3 1 - . 1 3 - . 0 1 . 0 4 - . 4 5

2 . 0 0 - 1 . 8 5 - 1 . 8 3 3 . 3 5 1 . 8 3 - . 1 2 - . 3 0 - 1 . 6 8 . 5 7

2 . 0 0 1 . 0 6 - . 5 5 - . 3 6 - . 8 0 - 1 . 4 1 - 1 . 4 9 . 8 9 . 8 2

2 . 0 0 - . 5 7 - 2 . 1 5 2 . 1 5 - . 9 9 - 1 . 6 3 . 0 0 - . 4 1 1 . 4 2

t - p r . 0 . 8 8 2 8 4 6 0 . 0 5 3 9 2 6 0 . 9 6 8 9 4 0 . 2 0 5 3 3 9 0 . 4 1 8 2 1 2 0 . 9 2 8 9 1 2 0 . 3 9 1 0 0 1 0 . 5 0 8 9 6 3

s z i g n . 4 e l s ő f a j t a h i b a v s z - e

Page 38: egy- és kétoldalas próbák, statisztikai hibák, ANOVA · A statisztika elméletének fontos része olyan döntési szabályok keresése, amely a próbát a lehető legerősebbé

Krisztina Boda 38

Az első fajta hiba növekedése,

összehasonlításonkénti és

kísérletenkénti szignifikancia Ha egy adott adathalmaz esetén adott változóra vagy változókra

vonatkozóan több statisztikai próbát is elvégzünk, mindegyiket adott mellett, az egész kísérletre vonatkozó az első fajta hibavalószínűség -nál sokkal nagyobb is lehet. Ez a meglepőnek látszó tényt a kétmintás t-próbával mutatjuk be:

Az =0.05 szint azt jelenti, hogy amennyiben a nullhipotézis igaz, (pl. az összehasonlítandó populációk között nincs különbség), az első fajta hiba elkövetésének valószínűsége 0.05, azaz minden száz ilyen esetből 5 alkalommal, nagyjából minden húszadik esetben követhetjük el ezt a hibát. Ennyiszer okoz ugyanis a véletlen a különben egyforma, azonos populációkból vett minták közt túlságosan nagy, általunk szignifikánsnak minősített különbséget. Ha több, azonos populációból vett mintát páronként hasonlítunk össze, 20 közül átlagosan 1 összehasonlítás szignifikáns eredményre vezet!

Általában, n számú független összehasonlítás esetén annak valószínűsége, hogy legalább egy összehasonlítás hibás (legalább egyszer elkövetjük az első fajta hibát), maximum:1-(1-)n

Page 39: egy- és kétoldalas próbák, statisztikai hibák, ANOVA · A statisztika elméletének fontos része olyan döntési szabályok keresése, amely a próbát a lehető legerősebbé

Krisztina Boda 39

A kísérletenkénti első fajta hiba valószínűségének növekedése

Emiatt hibás több csoport esetén az átlagok összehasonlítására páronkénti kétmintás t-próbákat végezni, vagy két csoport esetén több összefüggő változót szintén kétmintás t-próbákkal összehasonlítani. Nem tudhatjuk ugyanis, hogy a szignifikáns eredmények közül melyek tulajdoníthatók a véletlennek, és melyek tükröznek valódi különbséget.

Page 40: egy- és kétoldalas próbák, statisztikai hibák, ANOVA · A statisztika elméletének fontos része olyan döntési szabályok keresése, amely a próbát a lehető legerősebbé

Krisztina Boda 40

Sok kis darabból összecsomózott

hegymászókötél: az egyes csomók

95%-os valószínűséggel jól tartanak

Két csomó hibátlan voltának valószínűsége=0.95*0.95 =0.9025~90%

20 csomó hibátlan voltának valószínűsége=0.9520==0.358~36%

Lezuhanás valószínűsége 20 csomó esetén ~64%

Page 41: egy- és kétoldalas próbák, statisztikai hibák, ANOVA · A statisztika elméletének fontos része olyan döntési szabályok keresése, amely a próbát a lehető legerősebbé

Krisztina Boda 41

Megoldás:

sok t-próba helyett egyetlen varianciaanalízis

Az egyedi p-értékek korrekciója

Bonferroni

Holm

FDR (False Discovery Rate)

Page 42: egy- és kétoldalas próbák, statisztikai hibák, ANOVA · A statisztika elméletének fontos része olyan döntési szabályok keresése, amely a próbát a lehető legerősebbé

Krisztina Boda 42

ANOVA

Analysis of Variance

Több (>2), normális eloszlású populáció átlagának

összehasonlítására szolgáló módszer

Fajtái:

Egyszempontos (one-way):

kontroll, kezelés I, kezelés II.

Többszempontos (Kezelés, nem: a kettő együtt hogy hat)

Bármelyik szempont lehet

„független” („between-subjects”) pl. nem, kezelési csoportok

„ismételt méréses” („within-subjects”) pl. időben mért ismétlések

Page 43: egy- és kétoldalas próbák, statisztikai hibák, ANOVA · A statisztika elméletének fontos része olyan döntési szabályok keresése, amely a próbát a lehető legerősebbé

Krisztina Boda 43

Példa

Egy kísérletben (Farkas ésmtsai, 2003.) lokálisiszkémiának alávetett, izoláltpatkányszívben aszívfrekvencia és a QT szakaszhosszának változását vizsgáltákhárom antiaritmiás gyógyszerhatására. 5 Mm K+ kálium ionkoncentráció esetén, 25 perccela lokális iszkémia után a QTszakasz hosszára a 4.8.táblázatban látható értékeketkapták. Vizsgáljuk meg, hogy a4 csoportban van-e különbség aQT szakasz átlagos hosszában!

Kontroll Quinidine Lidocaine Flecainide

61 76 65 69

53 84 56 65

68 89 76 73

66 78 72 71

54 81 66 61

89 69 69

átlag 60.4 82.8 67.3 68.0

SD 6.80 5.49 6.86 4.34

40

50

60

70

80

90

100

Kontroll Quinidine Lidocaine Flecainide

Page 44: egy- és kétoldalas próbák, statisztikai hibák, ANOVA · A statisztika elméletének fontos része olyan döntési szabályok keresése, amely a próbát a lehető legerősebbé

Krisztina Boda 44

Egyszempontos ANOVA

Feltételek, nullhipotézis Feltételek:

Az egyedek véletlenszerűen kerülnek egyik vagy másik csoportba, a minták független minták (egy egyed csak egy csoportba kerülhet).

Az összehasonlítandó értékeket tartalmazó változó folytonos.

A minták normális eloszlású populációból származnak.

Azok a populációk, amelyekből a minták származnak, azonos varianciájúak.

Nullhipotézis: A független minták azonos eloszlású populációból származnak, azaz

a populáció-átlagok megegyeznek

H0: 1= 2=…= t t a csoportok száma (t kezelés - treatment)

HA: i≠ j i ≠j, i,j=1,2,…t (van a csoport-átlagok között különböző)

Page 45: egy- és kétoldalas próbák, statisztikai hibák, ANOVA · A statisztika elméletének fontos része olyan döntési szabályok keresése, amely a próbát a lehető legerősebbé

Krisztina Boda 45

Módszer Az ANOVA a teljes adathalmaz összvarianciáját kétféle forrásból

származtatja: Csoportok közötti

Csoportokon belüli

Ha igaz az a nullhipotézis, hogy a populáció-átlagok megegyeznek, (H0: 1= 2=…= t), akkor a populációban a csoportok közötti és a csoportokon belüli variancia is megegyezik. A kettő hasonlításával lehet következtetni az átlagok azonosságára.

‘új’ nullhipotézis: A populációban a csoportok közötti és a csoportokon belüli variancia megegyezik. 2

között=2belül

Tesztelése: F-próba (egyoldalas).

Egy p-értéket ad: ha p>0.05, akkor elfogadjuk az átlagok azonosságát (H0)

ha p<0.05, akkor van az átlagok között különböző

Page 46: egy- és kétoldalas próbák, statisztikai hibák, ANOVA · A statisztika elméletének fontos része olyan döntési szabályok keresése, amely a próbát a lehető legerősebbé

Krisztina Boda 46

. 0

1

2

3

4

5

6

7

0 1 2 3 4

0

1

2

3

4

5

6

7

0 1 2 3 4

a) b

Azonos (a) és különböző (b) átlagú, egységnyi szórású normális eloszlású populációkból vett 6

elemű véletlen minták.

Page 47: egy- és kétoldalas próbák, statisztikai hibák, ANOVA · A statisztika elméletének fontos része olyan döntési szabályok keresése, amely a próbát a lehető legerősebbé

Krisztina Boda 47

A varianciaanalízis táblázata

A variancia analízis számításait általában táblázatba szokták foglalni

A szóródás oka Négyzetösszeg Szabadságfok Variancia F

Csoportok

között 2

1

)( xxnQ ii

t

i

k

t-1 1

2

t

Qs k

k Fs

s

k

b

2

2

Csoportokon

belül 2

11

)( iij

n

j

t

i

b xxQi

N-t tN

Qs b

b

2

Teljes

2

11

)( xxQ ij

n

j

t

i

i

N-1

Page 48: egy- és kétoldalas próbák, statisztikai hibák, ANOVA · A statisztika elméletének fontos része olyan döntési szabályok keresése, amely a próbát a lehető legerősebbé

Krisztina Boda 48

A varianciaanalízis táblázata példafeladat adataira

A szóródás oka Négyzetösszeg Szabadságfok Variancia F p

Csoportok között 1515.590 3 505.197 14.426 0.000

Csoportokon belül 665.367 19 35.019

Teljes 2180.957 22

40

50

60

70

80

90

100

Kontroll Quinidine Lidocaine Flecainide

F(3,19)=14.426, p<0.001, a különbség szignifikáns,

csoport-átlagok között van legalább egy, a többitől eltérő

Page 49: egy- és kétoldalas próbák, statisztikai hibák, ANOVA · A statisztika elméletének fontos része olyan döntési szabályok keresése, amely a próbát a lehető legerősebbé

Krisztina Boda

További teendők, ha a varianciaanalízis

eredménye szignifikáns

Ha megállapítottuk, hogy az átlagok nem

mind azonosak, felmerül a kérdés, hol van

a különbség?

Ismételt t-próbákkal nem dolgozhatunk (1.

fajta hibanövekedés)

Speciális páronkénti összehasonlítások (post-

hoc tesztek)

Előre tervezett összehasonlítások

Page 50: egy- és kétoldalas próbák, statisztikai hibák, ANOVA · A statisztika elméletének fontos része olyan döntési szabályok keresése, amely a próbát a lehető legerősebbé

Krisztina Boda

Páronkénti hasonlítások Módosított t-próbák

(LSD)

Bonferroni

Scheffé

Tukey

Dunnett- egy kontrollhoz hasonlítja a többi csoportot

Az átlagok különbsége Dunnett - p

Kontroll – Quinidine 22.4333 .000

Kontroll – Lidocaine 6.9333 .158

Kontroll – Flecainide 7.6000 .113

Page 51: egy- és kétoldalas próbák, statisztikai hibák, ANOVA · A statisztika elméletének fontos része olyan döntési szabályok keresése, amely a próbát a lehető legerősebbé

Krisztina Boda 51

Páronkénti hasonlítások

Multiple Comparisons

Dependent Variable: QT

LSD

-22.43333* 3.58335 .000 -29.9334 -14.9333

-6.93333 3.58335 .068 -14.4334 .5667

-7.60000* 3.58335 .047 -15.1000 -.1000

22.43333* 3.58335 .000 14.9333 29.9334

15.50000* 3.41659 .000 8.3490 22.6510

14.83333* 3.41659 .000 7.6823 21.9843

6.93333 3.58335 .068 -.5667 14.4334

-15.50000* 3.41659 .000 -22.6510 -8.3490

-.66667 3.41659 .847 -7.8177 6.4843

7.60000* 3.58335 .047 .1000 15.1000

-14.83333* 3.41659 .000 -21.9843 -7.6823

.66667 3.41659 .847 -6.4843 7.8177

(J) CSoport

Quinidine

Lidocaine

Flecainide

Kontroll

Lidocaine

Flecainide

Kontroll

Quinidine

Flecainide

Kontroll

Quinidine

Lidocaine

(I) CSoport

Kontroll

Quinidine

Lidocaine

Flecainide

MeanDif f erence

(I-J) Std. Error Sig. Lower Bound Upper Bound

95% Conf idence Interv al

The mean dif f erence is signif icant at the .05 lev el.*.

Multiple Comparisons

Dependent Variable: QT

Bonf erroni

-22.43333* 3.58335 .000 -32.9823 -11.8843

-6.93333 3.58335 .408 -17.4823 3.6157

-7.60000 3.58335 .284 -18.1490 2.9490

22.43333* 3.58335 .000 11.8843 32.9823

15.50000* 3.41659 .001 5.4419 25.5581

14.83333* 3.41659 .002 4.7752 24.8914

6.93333 3.58335 .408 -3.6157 17.4823

-15.50000* 3.41659 .001 -25.5581 -5.4419

-.66667 3.41659 1.000 -10.7248 9.3914

7.60000 3.58335 .284 -2.9490 18.1490

-14.83333* 3.41659 .002 -24.8914 -4.7752

.66667 3.41659 1.000 -9.3914 10.7248

(J) CSoport

Quinidine

Lidocaine

Flecainide

Kontroll

Lidocaine

Flecainide

Kontroll

Quinidine

Flecainide

Kontroll

Quinidine

Lidocaine

(I) CSoport

Kontroll

Quinidine

Lidocaine

Flecainide

MeanDif f erence

(I-J) Std. Error Sig. Lower Bound Upper Bound

95% Conf idence Interv al

The mean dif f erence is signif icant at the .05 lev el.*.

pBonferroni=pLSD*összehasonlítások száma=pLSD*6

Page 52: egy- és kétoldalas próbák, statisztikai hibák, ANOVA · A statisztika elméletének fontos része olyan döntési szabályok keresése, amely a próbát a lehető legerősebbé

Krisztina Boda

R futtatás

> csoport<-factor(c(1,1,1,1,1,2,2,2,2,2,2,3,3,3,3,3,3,4,4,4,4,4,4)) > mit<-c(61,53,68,66,54,76,84,89,78,81,89,65,56,76,72,66,69,69,65,73,71,61,69) > mean(mit[csoport==1]);sd(mit[csoport==1]) [1] 60.4 [1] 6.80441 > mean(mit[csoport==2]);sd(mit[csoport==2]) [1] 82.83333 [1] 5.492419 > mean(mit[csoport==3]);sd(mit[csoport==3]) [1] 67.33333 [1] 6.860515 > mean(mit[csoport==4]);sd(mit[csoport==4]) [1] 68 [1] 4.335897 > boxplot(mit~csoport) > fit<-aov(mit~csoport) #1-es tipusu, unbalanced eseten > fit Call: aov(formula = mit ~ csoport) Terms: csoport Residuals Sum of Squares 1515.5899 665.3667 Deg. of Freedom 3 19 Residual standard error: 5.917711 Estimated effects may be unbalanced > summary(fit) #szokasos ANOVA tablat adja Df Sum Sq Mean Sq F value Pr(>F) csoport 3 1515.6 505.2 14.43 3.89e-05 *** Residuals 19 665.4 35.0 --- Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 > pairwise.t.test(mit,csoport,p.adj="none") #LSD Pairwise comparisons using t tests with pooled SD data: mit and csoport 1 2 3 2 5.2e-06 - - 3 0.06804 0.00023 - 4 0.04731 0.00035 0.84737 P value adjustment method: none > pairwise.t.test(mit,csoport,p.adj="bon") #Bonferroni Pairwise comparisons using t tests with pooled SD data: mit and csoport 1 2 3 2 3.1e-05 - - 3 0.4082 0.0014 - 4 0.2839 0.0021 1.0000 P value adjustment method: bonferroni

Page 53: egy- és kétoldalas próbák, statisztikai hibák, ANOVA · A statisztika elméletének fontos része olyan döntési szabályok keresése, amely a próbát a lehető legerősebbé

Krisztina Boda

Kérdések és feladatok

Miért nem helyes több csoport átlagának

összehasonlítására páronként t-próbákat

alkalmazni?

A Bonferroni korrekció

Az egyszempontos varianciaanalízis céja,

null- és alternatív hipotézise

A varianciaanalízis elve (milyen

varianciákat hasonlít?), táblázata

Páronkénti hasonlítások

Page 54: egy- és kétoldalas próbák, statisztikai hibák, ANOVA · A statisztika elméletének fontos része olyan döntési szabályok keresése, amely a próbát a lehető legerősebbé

Krisztina Boda 54

Hasznos WEB oldalak

Klinikai Biostatisztikai Társaság

http://www.biostat.hu

Rice Virtual Lab in Statistics

http://davidmlane.com/hyperstat/intro_ANOVA.

html

Statistics on the Web

http://www.claviusweb.net/statistics.shtml