Upload
others
View
3
Download
0
Embed Size (px)
Citation preview
Biostatisztika
Hipotézisvizsgálatok,
egy- és kétoldalas próbák,
statisztikai hibák, ANOVA
Dr. Boda Krisztina PhD
SZTE ÁOK Orvosi Fizikai és Orvosi
Informatikai Intézet
Krisztina Boda 2
Hipotézisvizsgálatok
A hipotézisvizsgálat során a rendelkezésre
álló adatok (statisztikai minta) alapján az
egész jelenség (populáció) tulajdonságaira
következtetünk.
Azt vizsgáljuk, hogy a tapasztalt eredmény
(különbség) nagyobb-e, mint amit a véletlen
önmagában okoz.
Krisztina Boda 3
Mintavétel, szimuláció
Legyen a populáció 120 átlagú, 10
szórású normális eloszlás, ebből veszünk
50 elemű mintákat
Krisztina Boda 4
Histogram: s2
K-S d=.08901, p> .20; Lilliefors p> .20
Expected Normal
80 90 100 110 120 130 140 150 160
X <= Category Boundary
0
5
10
15
20
25
No. o
f obs.
Krisztina Boda 5
Histogram: s3
K-S d=.06554, p> .20; Lilliefors p> .20
Expected Normal
80 90 100 110 120 130 140 150 160
X <= Category Boundary
0
2
4
6
8
10
12
14
16
18
20
No. o
f obs.
Krisztina Boda 6
Histogram: s4
K-S d=.05667, p> .20; Lilliefors p> .20
Expected Normal
80 90 100 110 120 130 140 150 160
X <= Category Boundary
0
5
10
15
20
25
No. o
f obs.
Krisztina Boda 7
Histogram: s5
K-S d=.06256, p> .20; Lilliefors p> .20
Expected Normal
80 90 100 110 120 130 140 150 160
X <= Category Boundary
0
2
4
6
8
10
12
14
16
18
20
No. o
f obs.
Krisztina Boda 8
Histogram: s6
K-S d=.11902, p> .20; Lilliefors p<.10
Expected Normal
80 90 100 110 120 130 140 150 160
X <= Category Boundary
0
2
4
6
8
10
12
14
16
18
20
22
No. o
f obs.
Krisztina Boda 9
Histogram: s7
K-S d=.07360, p> .20; Lilliefors p> .20
Expected Normal
80 90 100 110 120 130 140 150 160
X <= Category Boundary
0
5
10
15
20
25
No. o
f obs.
Krisztina Boda 10
120 átlagú, 10 szórású populációból származó 50
elemű minták átlagai és szórásai
0
20
40
60
80
100
120
140
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
ismétlés
átl
ag
+ S
D
Krisztina Boda 11
Mekkora lehet a véletlen ingadozás?
A minták átlagai 120 körül ingadoznak, ha
„nem történik semmi”, csak sima ismétlés
Két mérés különbségének átlaga a 0 körül
ingadozik
Mekkora az a különbség, amit már nem a
véletlen okoz?
Krisztina Boda 12
Hipotézisek
Nullhipotézis: véletlen
ingadozást mértem,
„semmi nem történt”.
A különbség 0 körül
ingadozik
Alternatív hipotézis: a
véletlen ingadozásnál
nagyobbat mértem,
„valami történt”
A különbség 0-tól eltérő
szám körül ingadozik
???
y=student(x;49)
-3 -2 -1 0 1 2 3
0.0
0.1
0.2
0.3
0.4
0.5
p=2*(1-istudent(abs(x);49))
-3 -2 -1 0 1 2 3
0.0
0.2
0.4
0.6
0.8
1.0
0
Krisztina Boda 13
Hipotézisek tesztelése
Mekkora esélyt adjunk a véletlennek?
(Megbízhatósági szint).
Akármennyi lehet, (tőlünk függ), általában 95%
Mekkora esélyt adjunk annak, hogy esetleg
hibásan döntünk (szignifikancia szint)
Általában 5% (=0.05)
Krisztina Boda 14
A hipotézisvizsgálat menete
Hipotézisek felállítása Nullhipotézis: semmi nem történt
Alternatív hipotézis: valami változás van
A döntés megbízhatósága (vagy a hiba) rögzítése: =0.05
Döntési szabály felállítása (függ: a kísérleti elrendezéstől, -tól, az elemszámtól)
Minta-elemszám meghatározása
A minta előállítása (mérés, adatgyűjtés,stb)
A döntési szabály kiszámítása
Döntés A nullhipotézist elfogadjuk (nincs szignifikáns különbség szinten,
nincs elegendő információ a különbség (hatás) kimutatására)
A nullhipotézist elvetjük, a különbség szignifikáns %-os szinten. A tapasztalt különbség nem csupán a véletlen műve, valami más hatás (kezelés??) is közbejátszott.
Krisztina Boda 15
Student féle t-próbák
Általános cél. A Student t-próbák normális eloszlású populációk átlagait vizsgálják. A hipotézisek teszteléséhez egy t próbastatisztikát használnak, amely a nullhipotézis fennállása esetén adott szabadságfokú t-eloszlást követ.
Egymintás t-próba. Adott egyetlen minta, amelyről feltesszük, hogy normális eloszlásból származik. A próbával azt teszteljük, hogy a populáció-átlag lehet-e egy adott konstans H0: =c
Páros t-próba (= egymintás t-próba a különbségekre). Két összetartozó mintát vizsgál. Feltételezzük, hogy a különbség-minta normális eloszlásból származik. A próbával azt teszteljük, hogy a különbség-átlag a populációban lehet-e nulla H0: különbség=0
Kétmintás t-próba ( independent samples t-test). Két független mintánk van, mindegyikről feltétezzük, hogy normális eloszlású populációból származik. A próbával azt teszteljük, hogy a két populáció-átlag azonos-e H0: 1= 2
Krisztina Boda 16
Normális eloszlást feltételezve,
az átlagok összehasonlítására használható próbák
Egy minta esete: egymintás t-próba
Két minta esete: Összetartozó minták: (előtt-után, baloldal-jobboldal):
páros t-próba= egymintás t-próba a különbségekre
Független minták (placebo-kezelés, férfi-nő, beteg-egészséges): kétmintás t-próba Azonos szórások esetén „klasszikus”
Különböző szórások esetén „módosított” (Welch, D)
Szórások egyezésének tesztelése: F-próba, Levene-próba
Több (>2) minta esete: varianciaanalízis
3. Egyváltozós statisztikák
Krisztina Boda
t-próbák végrehajtásának általános menete
Null- és alternatív hipotézis felállítása
Rögzítjük -t
Ellenőrizzük a feltételeket legalább grafikusan
Normalitásvizsgálat, kétmintás t-próba esetén a varianciák azonossága
– a hisztogramok illetve boksz diagramok alapján
A próbastatisztika kiszámítása – általában egy formula
Döntés táblabeli t-érték (ttáblázat ) alapján döntés( kézi számolás)
|t|>ttáblázat - elvetjük H0-t (elfogadjuk Ha-t) és azt mondjuk, hogy a
különbség szignifikáns szinten
|t|<ttáblázat – nem vetjük el H0-t (elfogadjuk) és azt mondjuk, hogy a
különbség nem szignifikáns szinten
Döntés p-érték alapján (számítógép)
p< - elvetjük H0-t (elfogadjuk Ha-t) és azt mondjuk, hogy a különbség
szignifikáns szinten
p> - nem vetjük el H0-t (elfogadjuk) és azt mondjuk, hogy a különbség
nem szignifikáns szinten17
Statisztikai próbákról
általában
Krisztina Boda 19
Egy- és kétoldalas próbák
Kétoldalas próba
H0: nincs változás 1=2
Ha: van változás (bármilyen
irányú) 12
Egyoldalas próba
H0: az átlag nem csökkent,
1≤2
Ha: az átlag csökkent, 1>2
9 szabadságfokú t-eloszlás
0.025 0.05
Más lesz a táblabeli kritikus érték. pegyoldalas=pkétoldalas/2
Krisztina Boda 20
valószínűség
df 0.2 0.1 0.05 0.02 0.01 0.001
1 3.078 6.314 12.706 31.821 63.657 636.619
2 1.886 2.920 4.303 6.965 9.925 31.599
3 1.638 2.353 3.182 4.541 5.841 12.924
4 1.533 2.132 2.776 3.747 4.604 8.610
5 1.476 2.015 2.571 3.365 4.032 6.869
6 1.440 1.943 2.447 3.143 3.707 5.959
7 1.415 1.895 2.365 2.998 3.499 5.408
8 1.397 1.860 2.306 2.896 3.355 5.041
9 1.383 1.833 2.262 2.821 3.250 4.781
valószínűség
egyoldalas
0.1 0.05 0.025 0.01 0.005 0.0005
kétoldalas
df 0.2 0.1 0.05 0.02 0.01 0.001
1 3.078 6.314 12.706 31.821 63.657 636.619
2 1.886 2.920 4.303 6.965 9.925 31.599
3 1.638 2.353 3.182 4.541 5.841 12.924
4 1.533 2.132 2.776 3.747 4.604 8.610
5 1.476 2.015 2.571 3.365 4.032 6.869
6 1.440 1.943 2.447 3.143 3.707 5.959
7 1.415 1.895 2.365 2.998 3.499 5.408
Krisztina Boda 21
Szignifikancia
Szignifikáns a különbség – ha azt mondjuk, hogy van hatás, az esetleges hiba nagysága kicsi (maximum - ez az ún. első fajta hiba).
Nem szignifikáns különbség – ilyenkor csak annyit tudunk mondani, hogy nincs elegendő információ a különbség kimutatására. Lehet, hogy Valóban nincs is különbség
Van különbség, csak kevés volt az elemszám
Nagy volt a szórás
Rossz volt a vizsgálati módszer
…
A statisztikai szignifikanciát mindig át kell gondolni, vajon biológiai szempontból jelentős-e
Krisztina Boda 22
Statisztikai hibák Hipotézisvizsgálat során a minták alapján az összehasonlítandó
populációkról döntést hozunk: vagy azt állítjuk róluk, hogy különbözők, vagy azt, hogy azonosak. Bárhogyan döntünk is, nem tudhatjuk, hogy helyesen döntöttünk-e, mivel a valóságot nem ismerjük (a hipotézisvizsgálatot éppen ezért végezzük). Helyesen döntöttünk, ha különbséget állapítottunk meg és a populációk valóban eltérők, vagy ha nem állapítottunk meg különbséget, és a populációk valóban azonosak.
Döntés Igazság
HA igaz H0 igaz
Elvetjük H0-t helyes döntés első fajta hiba, Type I. error
(szign.) (álpozitív eredmény)
valószínűsége:
Nem vetjük el második fajta hiba, helyes döntés
H0-t Type II.error (álnegatív
(nem szign.) eredmény)
valószínűsége:
Krisztina Boda
A referencia teszt
Az általunk vizsgált (új) teszt eredménye
Pozitív (beteg) Negatív (nem beteg)
Pozitív VP – Valódi pozitív
(a)ÁP – Álpozitív
(b)Össz pozitív (a + b)
Negatív ÁN – Álnegatív
(c)
VN – Valódi negatív
(d)Össz negatív (c + d)
Összes beteg(a + c)
Összes nem beteg(b + d)
Összes eset (n=a+b+c+d)
Kereszt-osztályozás ̶ emlékeztető
Szenzitivitás= a/(a+c) ∙100% P(T+|B) = P(T+ B)/P(B)
Specificikusság= d/(b+d) ∙100% P(T-|E ) = P(T- E )/P(E )
Pozitív prediktív érték= a/(a+b) ∙100%
Negatív prediktív érték = d/(c+d) ∙100%
Validitás = (a+d)/(a+b+c+d) ∙100%
Álnegativitási arány= c/(a+c) ∙100% ;
Álpozitivitási arány= b(b+d) ∙100% ;
Krisztina Boda 24
Első fajta hiba, Type I. error
Előfordulhat, hogy szignifikáns különbséget állapítunk meg, pedig valójában nincs különbség. Ebben az esetben a döntés hibás, az elkövetett hibát első fajta hibának nevezik, nagyságát elkövetésének valószínűségével szokás megadni. Az első fajta hiba valószínűsége annak esélye, hogy a tapasztalt különbséget a véletlen okozta, ez éppen a szignifikanciaszinttel egyenlő (). Ha több összehasonlítást végzünk, pl. több csoportot páronként hasonlítunk össze, ez a hiba halmozódhat.
Krisztina Boda 25
Második fajta hiba, Type II.error
Hipotézisvizsgálat során nem állapítunk meg szignifikáns különbséget, pedig valójában – azaz a populációk között –mégis van különbség. Ebben az esetben a döntés hibás, az így elkövetett hibát második fajta hibának nevezik.
A második fajta hiba valószínűségét () általában nem ismerjük, mivel függ a szignifikanciaszinttől (),
az elemszámtól,
a populáció(k) szórásától
tényleges különbség (hatás) nagyságától
egyéb tényezők (milyen próba, a feltételek teljesülése, a kísérleti elrendezés, ..)
A második fajta hiba valószínűségének kiszámítását az nehezíti, hogy nem ismerjük a populációk közötti tényleges különbséget, így gyakran ehelyett a megfelelőnek tekintett különbséget (pl. a legkisebb klinikailag jelentős különbség), vagy a minták átlagai alapján becsült különbséget alkalmazzák. A populáció szórását pedig a minta(ák)ból számolt szórással közelítik.
Krisztina Boda 26
A próba ereje
A második fajta hiba valószínűsége helyett inkább (1–)-t, a próba erejét szokták megadni A próba ereje azt méri, hogy a próba milyen jó abban az esetben, ha elvetjük a hamis nullhipotézist. Minél erősebb a próba, (minél közelebb van értéke 1-hez), annál nagyobb valószínűséggel veti el a hamis nullhipotézist. Másképpen: a próba ereje annak valószínűsége, hogy egy különbséget — adott mintanagyság és szignifikancia-szint mellett — egy statisztikai próba kimutat. A vizsgálatok tervezésének gyakorlatában az erő nagyságának előre megszabott értékéből kiindulva határozzák meg a szükséges mintaelemszámot.
A statisztika elméletének fontos része olyan döntési szabályok keresése, amely a próbát a lehető legerősebbé teszi adott esetén.
Krisztina Boda 27
Második fajta hiba, Type II.error
„Ha a ködben semmit sem látsz, ez
távolról sem jelenti azt, hogy nincs ott
semmi”. (Piepenbrink kapitány – Hans-Peter Beck-Bernholdt,
Hans-Hermann Dubben: A tojást rakó kutya. Magyar
könyvklub, 1999.)
Krisztina Boda 28
Második fajta hiba, Type II.error
Krisztina Boda 29
A próba ereje adott elemszám és
esetén, különböző alternatív hipotézisek
mellett
Krisztina Boda 30
A próba ereje adott elemszám és
esetén, különböző alternatív hipotézisek
mellett
Krisztina Boda 31
Legyen a H0-ban és a H1-ben megfogalmazott átlag µ0 ill. µ1 .
Adott α,β, µ0 ill. µ1 esetén, konstans és ismert szórást tekintve a kritikus értékek a következők:
Kétoldalas α=0.05 esetén zα =1.96,
Egyoldalas β=0.1 esetén zβ =1.28.
Az egyenletekből az átlagot kifejezve és a két oldalt egyenlővé téve az n:
Két átlag (változás) összehasonlításához szükséges
elemszám ismert esetén
n
xz
0
n
xz
1
n
xz
0
2
01
)(
zzn
µ0 µ1
zα zβ
Krisztina Boda
Kérdések
Ha két mintaátlagát vizsgálom, milyen esetben (milyen kísérlet esetén) lehet páros t-próbát és milyen esetben lehet kétmintás t-próbát alkalmazni?
A kétmintás t-próba feltételei
A kétmintás t-próba nullhipotézise
A kétmintás t-próba végrehajtása azonos és különböző varianciák esetén
A varianciák összehasonlítása: F-próba
A statisztikai szignifikancia jelentése és értelmezése
Statisztikai hibák
Az első fajta hiba jelentése és valószínűsége
A második fajta hiba jelentése és valószínűsége. Mitől függ?
A próba ereje
Elemszámbecslés két átlag összehasonlításához (mitől függ?)
Krisztina Boda
Feladat A kalcium hatását vizsgálták a vérnyomásra két csoportban. A kezelés előtt és a kezelés után
mért különbségeket hasonlították össze kétmintás t-próbával. Értelmezze az alábbi eredményeket! Kimutatható-e 5%-os hibát feltételezve, hogy a kalcium kezelés csökkenti a vérnyomást?
Vérnyomás-esés alapstatisztikák
t-próba eredménye: különböző varianciákat feltételezve, t=1.604, szabadságfok=15.591, p=0.129-et kaptunk. (Útmutatás: elegendő a p-érték alapján dönteni, p>0.05, a különbség nem szignifikáns 5%-os szinten)
Group Statistics
10 5.0000 8.74325 2.76486
11 -.2727 5.90069 1.77913
treat
Calcium
Placebo
decr
N Mean Std. Dev iationStd. Error
Mean
Independent Samples Test
4.351 .051 1.634 19 .119 5.27273 3.22667 -1.48077 12.02622
1.604 15.591 .129 5.27273 3.28782 -1.71204 12.25749
Equal variances assumed
Equal variances notassumed
decr
F Sig.
Levene's Test f orEquality of Variances
t df Sig. (2-tailed)Mean
Dif f erenceStd. ErrorDif f erence Lower Upper
95% Conf idenceInterv al of the
Dif f erence
t-test for Equality of Means
Krisztina Boda
Feladatok1. Vajon azonos-e a diabeteses és nem diabeteses populáció átlag- cholesterin
szintje? Egy vizsgálatban az 1941-50 között születettek korcsoportjában a
következő eredményeket kapták:
Kontroll csoport n=63, átlag=5.27, SD=1.16
Diabetes csoport n=52, átlag=4.63, SD=1.31.
A kérdés eldöntésére milyen statisztikai próbát használ?
Mik a próba feltételei?
A próbastatisztika értéke t=2.327. Szignifikáns-e a különbség? Döntsön 5%-os
szinten (α =0.05)
A p-érték 0.022. Szignifikáns-e a különbség 5%-os szinten?
2. Vajon azonos-e a hallgatók populációjában a fiúk és lányok átlagéletkora? Az
idegen nyelvű képzésben szereplő hallgatók adatait elemezve, az átlagok
összehasonlítására a következő eredményeket kapták:
Fiú: n=4, átlag=21.18, SD=3.025
Lány: n=53, átlag=20.38, SD=3.108
A kérdés eldöntésére milyen statisztikai próbát használ?
Mik a próba feltételei?
A próbastatisztika értéke t=1.505. Szignifikáns-e a különbség? Döntsön 5%-os
szinten (α =0.05)
A p-érték 0.807. Szignifikáns-e a különbség 5%-os szinten?
34
Krisztina Boda
Problémák több próba végrehajtásakor
Krisztina Boda 36
Ugyanazon populációból származó minták
páronkénti összehasonlítása t-próbával
T-test for Dependent Samples: p-levels (veletlen)
Marked differences are significant at p < .05000
Variable s10 s11 s12 s13 s14 s15 s16 s17 s18 s19 s20
s1
s2
s3
s4
s5
s6
s7
s8
s9
0.3040790.0748480.7817330.1587250.2227190.1512340.2110680.0282620.6567540.0487890.223011
0.9438540.3269300.4451070.4500320.7992430.4684940.7328960.3510880.5898380.3124180.842927
0.3646990.1001370.8345800.1516180.3007730.1529770.2010400.1366360.7121070.0927880.348997
0.3350900.9125990.0695440.8118460.4909040.6467310.5213770.9945350.1728660.9772530.338436
0.4926170.1396550.9983070.2362340.4206370.1864810.3629480.1438860.8657910.1472450.399857
0.9048030.2852000.5921600.4298820.7745240.4941630.6747320.3927920.7078670.3301320.796021
0.1575640.8777970.0537520.6317880.3610120.5259930.3523910.7968600.0926150.8187090.263511
0.4622230.8589110.1567110.8788900.6241230.7894860.5698770.9320530.1360040.9235810.564532
0.4199120.0401890.8753610.1674410.3576680.1739770.2587940.0994880.7577670.0687990.371769
0
20
40
60
80
100
120
140
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
ismétlés
átl
ag
+ S
D
Krisztina Boda 37
Miért nem t-próbákat végzünk páronként?
Mert a véletlen is okozhat „szignifikáns eredményt
átlagosan minden 20-adik esetben.
CSOP R1 R2 R3 R4 R5 R6 R7 R8
1 . 0 0 - . 8 4 1 . 7 3 2 . 3 6 - . 3 0 - . 3 1 - . 3 1 - . 5 6 1 . 5 8
1 . 0 0 . 5 9 . 4 4 . 6 0 - . 7 5 - . 2 8 - 1 . 5 1 - . 8 1 - . 1 2
1 . 0 0 . 1 9 - . 7 3 - 1 . 0 4 1 . 2 7 . 6 9 - . 2 1 - . 5 2 - 1 . 3 4
1 . 0 0 - 1 . 0 5 . 8 8 1 . 2 7 1 . 0 5 - . 8 7 . 6 8 - . 1 7 - . 1 5
1 . 0 0 . 1 2 - . 7 5 - . 0 5 - 1 . 1 3 2 . 2 1 . 7 4 - . 9 0 - . 4 5
1 . 0 0 1 . 1 0 - . 2 0 - . 7 8 1 . 0 2 . 6 7 . 1 8 - . 5 2 - . 3 4
1 . 0 0 - . 1 9 - . 5 7 - . 4 1 2 . 2 5 - 1 . 2 6 - . 2 7 . 4 4 - 2 . 5 2
1 . 0 0 . 4 5 1 . 2 0 2 . 7 7 - . 1 7 - . 6 8 . 6 0 . 5 4 - . 3 7
1 . 0 0 - . 5 8 - . 0 1 . 6 0 1 . 6 6 2 . 1 4 2 . 3 1 - . 9 0 - 1 . 7 5
1 . 0 0 - . 3 9 . 9 3 - . 5 1 . 3 1 - . 6 0 - . 2 1 . 5 5 . 5 7
1 . 0 0 - . 2 3 - 1 . 2 1 - 1 . 0 8 . 0 2 . 3 1 - 1 . 2 8 1 . 2 0 1 . 6 2
1 . 0 0 . 8 7 . 9 7 - 1 . 0 4 . 6 0 - . 2 9 . 8 6 1 . 0 9 - . 6 8
2 . 0 0 . 4 2 - 1 . 1 8 - . 6 4 - . 0 8 1 . 1 0 . 3 9 - . 6 6 2 . 1 2
2 . 0 0 1 . 2 6 - 2 . 1 3 - 1 . 7 8 - . 6 0 - 1 . 2 5 - 1 . 1 0 . 1 9 - 1 . 5 4
2 . 0 0 - . 6 0 - . 8 3 - . 9 4 1 . 6 1 . 9 5 1 . 3 7 . 1 0 - . 9 7
2 . 0 0 - 1 . 7 5 . 6 3 . 1 6 . 2 4 - . 2 5 1 . 4 9 . 4 2 - 2 . 0 1
2 . 0 0 . 0 7 - . 3 3 - . 5 6 . 3 6 . 1 2 - . 4 8 . 7 8 - 1 . 2 9
2 . 0 0 . 1 5 . 8 5 . 1 0 - 2 . 0 7 . 1 8 2 . 1 4 1 . 7 1 . 6 2
2 . 0 0 . 9 8 - 1 . 2 0 - . 4 6 - . 9 2 . 0 8 - 1 . 3 7 . 8 0 - . 6 7
2 . 0 0 - . 4 2 1 . 0 5 - . 2 9 . 7 3 . 1 0 1 . 4 2 . 7 9 1 . 6 7
2 . 0 0 2 . 0 0 . 0 6 2 . 2 4 - . 3 1 - . 1 3 - . 0 1 . 0 4 - . 4 5
2 . 0 0 - 1 . 8 5 - 1 . 8 3 3 . 3 5 1 . 8 3 - . 1 2 - . 3 0 - 1 . 6 8 . 5 7
2 . 0 0 1 . 0 6 - . 5 5 - . 3 6 - . 8 0 - 1 . 4 1 - 1 . 4 9 . 8 9 . 8 2
2 . 0 0 - . 5 7 - 2 . 1 5 2 . 1 5 - . 9 9 - 1 . 6 3 . 0 0 - . 4 1 1 . 4 2
t - p r . 0 . 8 8 2 8 4 6 0 . 0 5 3 9 2 6 0 . 9 6 8 9 4 0 . 2 0 5 3 3 9 0 . 4 1 8 2 1 2 0 . 9 2 8 9 1 2 0 . 3 9 1 0 0 1 0 . 5 0 8 9 6 3
s z i g n . 4 e l s ő f a j t a h i b a v s z - e
Krisztina Boda 38
Az első fajta hiba növekedése,
összehasonlításonkénti és
kísérletenkénti szignifikancia Ha egy adott adathalmaz esetén adott változóra vagy változókra
vonatkozóan több statisztikai próbát is elvégzünk, mindegyiket adott mellett, az egész kísérletre vonatkozó az első fajta hibavalószínűség -nál sokkal nagyobb is lehet. Ez a meglepőnek látszó tényt a kétmintás t-próbával mutatjuk be:
Az =0.05 szint azt jelenti, hogy amennyiben a nullhipotézis igaz, (pl. az összehasonlítandó populációk között nincs különbség), az első fajta hiba elkövetésének valószínűsége 0.05, azaz minden száz ilyen esetből 5 alkalommal, nagyjából minden húszadik esetben követhetjük el ezt a hibát. Ennyiszer okoz ugyanis a véletlen a különben egyforma, azonos populációkból vett minták közt túlságosan nagy, általunk szignifikánsnak minősített különbséget. Ha több, azonos populációból vett mintát páronként hasonlítunk össze, 20 közül átlagosan 1 összehasonlítás szignifikáns eredményre vezet!
Általában, n számú független összehasonlítás esetén annak valószínűsége, hogy legalább egy összehasonlítás hibás (legalább egyszer elkövetjük az első fajta hibát), maximum:1-(1-)n
Krisztina Boda 39
A kísérletenkénti első fajta hiba valószínűségének növekedése
Emiatt hibás több csoport esetén az átlagok összehasonlítására páronkénti kétmintás t-próbákat végezni, vagy két csoport esetén több összefüggő változót szintén kétmintás t-próbákkal összehasonlítani. Nem tudhatjuk ugyanis, hogy a szignifikáns eredmények közül melyek tulajdoníthatók a véletlennek, és melyek tükröznek valódi különbséget.
Krisztina Boda 40
Sok kis darabból összecsomózott
hegymászókötél: az egyes csomók
95%-os valószínűséggel jól tartanak
Két csomó hibátlan voltának valószínűsége=0.95*0.95 =0.9025~90%
20 csomó hibátlan voltának valószínűsége=0.9520==0.358~36%
Lezuhanás valószínűsége 20 csomó esetén ~64%
Krisztina Boda 41
Megoldás:
sok t-próba helyett egyetlen varianciaanalízis
Az egyedi p-értékek korrekciója
Bonferroni
Holm
FDR (False Discovery Rate)
…
Krisztina Boda 42
ANOVA
Analysis of Variance
Több (>2), normális eloszlású populáció átlagának
összehasonlítására szolgáló módszer
Fajtái:
Egyszempontos (one-way):
kontroll, kezelés I, kezelés II.
Többszempontos (Kezelés, nem: a kettő együtt hogy hat)
Bármelyik szempont lehet
„független” („between-subjects”) pl. nem, kezelési csoportok
„ismételt méréses” („within-subjects”) pl. időben mért ismétlések
Krisztina Boda 43
Példa
Egy kísérletben (Farkas ésmtsai, 2003.) lokálisiszkémiának alávetett, izoláltpatkányszívben aszívfrekvencia és a QT szakaszhosszának változását vizsgáltákhárom antiaritmiás gyógyszerhatására. 5 Mm K+ kálium ionkoncentráció esetén, 25 perccela lokális iszkémia után a QTszakasz hosszára a 4.8.táblázatban látható értékeketkapták. Vizsgáljuk meg, hogy a4 csoportban van-e különbség aQT szakasz átlagos hosszában!
Kontroll Quinidine Lidocaine Flecainide
61 76 65 69
53 84 56 65
68 89 76 73
66 78 72 71
54 81 66 61
89 69 69
átlag 60.4 82.8 67.3 68.0
SD 6.80 5.49 6.86 4.34
40
50
60
70
80
90
100
Kontroll Quinidine Lidocaine Flecainide
Krisztina Boda 44
Egyszempontos ANOVA
Feltételek, nullhipotézis Feltételek:
Az egyedek véletlenszerűen kerülnek egyik vagy másik csoportba, a minták független minták (egy egyed csak egy csoportba kerülhet).
Az összehasonlítandó értékeket tartalmazó változó folytonos.
A minták normális eloszlású populációból származnak.
Azok a populációk, amelyekből a minták származnak, azonos varianciájúak.
Nullhipotézis: A független minták azonos eloszlású populációból származnak, azaz
a populáció-átlagok megegyeznek
H0: 1= 2=…= t t a csoportok száma (t kezelés - treatment)
HA: i≠ j i ≠j, i,j=1,2,…t (van a csoport-átlagok között különböző)
Krisztina Boda 45
Módszer Az ANOVA a teljes adathalmaz összvarianciáját kétféle forrásból
származtatja: Csoportok közötti
Csoportokon belüli
Ha igaz az a nullhipotézis, hogy a populáció-átlagok megegyeznek, (H0: 1= 2=…= t), akkor a populációban a csoportok közötti és a csoportokon belüli variancia is megegyezik. A kettő hasonlításával lehet következtetni az átlagok azonosságára.
‘új’ nullhipotézis: A populációban a csoportok közötti és a csoportokon belüli variancia megegyezik. 2
között=2belül
Tesztelése: F-próba (egyoldalas).
Egy p-értéket ad: ha p>0.05, akkor elfogadjuk az átlagok azonosságát (H0)
ha p<0.05, akkor van az átlagok között különböző
Krisztina Boda 46
. 0
1
2
3
4
5
6
7
0 1 2 3 4
0
1
2
3
4
5
6
7
0 1 2 3 4
a) b
Azonos (a) és különböző (b) átlagú, egységnyi szórású normális eloszlású populációkból vett 6
elemű véletlen minták.
Krisztina Boda 47
A varianciaanalízis táblázata
A variancia analízis számításait általában táblázatba szokták foglalni
A szóródás oka Négyzetösszeg Szabadságfok Variancia F
Csoportok
között 2
1
)( xxnQ ii
t
i
k
t-1 1
2
t
Qs k
k Fs
s
k
b
2
2
Csoportokon
belül 2
11
)( iij
n
j
t
i
b xxQi
N-t tN
Qs b
b
2
Teljes
2
11
)( xxQ ij
n
j
t
i
i
N-1
Krisztina Boda 48
A varianciaanalízis táblázata példafeladat adataira
A szóródás oka Négyzetösszeg Szabadságfok Variancia F p
Csoportok között 1515.590 3 505.197 14.426 0.000
Csoportokon belül 665.367 19 35.019
Teljes 2180.957 22
40
50
60
70
80
90
100
Kontroll Quinidine Lidocaine Flecainide
F(3,19)=14.426, p<0.001, a különbség szignifikáns,
csoport-átlagok között van legalább egy, a többitől eltérő
Krisztina Boda
További teendők, ha a varianciaanalízis
eredménye szignifikáns
Ha megállapítottuk, hogy az átlagok nem
mind azonosak, felmerül a kérdés, hol van
a különbség?
Ismételt t-próbákkal nem dolgozhatunk (1.
fajta hibanövekedés)
Speciális páronkénti összehasonlítások (post-
hoc tesztek)
Előre tervezett összehasonlítások
Krisztina Boda
Páronkénti hasonlítások Módosított t-próbák
(LSD)
Bonferroni
Scheffé
Tukey
Dunnett- egy kontrollhoz hasonlítja a többi csoportot
…
Az átlagok különbsége Dunnett - p
Kontroll – Quinidine 22.4333 .000
Kontroll – Lidocaine 6.9333 .158
Kontroll – Flecainide 7.6000 .113
Krisztina Boda 51
Páronkénti hasonlítások
Multiple Comparisons
Dependent Variable: QT
LSD
-22.43333* 3.58335 .000 -29.9334 -14.9333
-6.93333 3.58335 .068 -14.4334 .5667
-7.60000* 3.58335 .047 -15.1000 -.1000
22.43333* 3.58335 .000 14.9333 29.9334
15.50000* 3.41659 .000 8.3490 22.6510
14.83333* 3.41659 .000 7.6823 21.9843
6.93333 3.58335 .068 -.5667 14.4334
-15.50000* 3.41659 .000 -22.6510 -8.3490
-.66667 3.41659 .847 -7.8177 6.4843
7.60000* 3.58335 .047 .1000 15.1000
-14.83333* 3.41659 .000 -21.9843 -7.6823
.66667 3.41659 .847 -6.4843 7.8177
(J) CSoport
Quinidine
Lidocaine
Flecainide
Kontroll
Lidocaine
Flecainide
Kontroll
Quinidine
Flecainide
Kontroll
Quinidine
Lidocaine
(I) CSoport
Kontroll
Quinidine
Lidocaine
Flecainide
MeanDif f erence
(I-J) Std. Error Sig. Lower Bound Upper Bound
95% Conf idence Interv al
The mean dif f erence is signif icant at the .05 lev el.*.
Multiple Comparisons
Dependent Variable: QT
Bonf erroni
-22.43333* 3.58335 .000 -32.9823 -11.8843
-6.93333 3.58335 .408 -17.4823 3.6157
-7.60000 3.58335 .284 -18.1490 2.9490
22.43333* 3.58335 .000 11.8843 32.9823
15.50000* 3.41659 .001 5.4419 25.5581
14.83333* 3.41659 .002 4.7752 24.8914
6.93333 3.58335 .408 -3.6157 17.4823
-15.50000* 3.41659 .001 -25.5581 -5.4419
-.66667 3.41659 1.000 -10.7248 9.3914
7.60000 3.58335 .284 -2.9490 18.1490
-14.83333* 3.41659 .002 -24.8914 -4.7752
.66667 3.41659 1.000 -9.3914 10.7248
(J) CSoport
Quinidine
Lidocaine
Flecainide
Kontroll
Lidocaine
Flecainide
Kontroll
Quinidine
Flecainide
Kontroll
Quinidine
Lidocaine
(I) CSoport
Kontroll
Quinidine
Lidocaine
Flecainide
MeanDif f erence
(I-J) Std. Error Sig. Lower Bound Upper Bound
95% Conf idence Interv al
The mean dif f erence is signif icant at the .05 lev el.*.
pBonferroni=pLSD*összehasonlítások száma=pLSD*6
Krisztina Boda
R futtatás
> csoport<-factor(c(1,1,1,1,1,2,2,2,2,2,2,3,3,3,3,3,3,4,4,4,4,4,4)) > mit<-c(61,53,68,66,54,76,84,89,78,81,89,65,56,76,72,66,69,69,65,73,71,61,69) > mean(mit[csoport==1]);sd(mit[csoport==1]) [1] 60.4 [1] 6.80441 > mean(mit[csoport==2]);sd(mit[csoport==2]) [1] 82.83333 [1] 5.492419 > mean(mit[csoport==3]);sd(mit[csoport==3]) [1] 67.33333 [1] 6.860515 > mean(mit[csoport==4]);sd(mit[csoport==4]) [1] 68 [1] 4.335897 > boxplot(mit~csoport) > fit<-aov(mit~csoport) #1-es tipusu, unbalanced eseten > fit Call: aov(formula = mit ~ csoport) Terms: csoport Residuals Sum of Squares 1515.5899 665.3667 Deg. of Freedom 3 19 Residual standard error: 5.917711 Estimated effects may be unbalanced > summary(fit) #szokasos ANOVA tablat adja Df Sum Sq Mean Sq F value Pr(>F) csoport 3 1515.6 505.2 14.43 3.89e-05 *** Residuals 19 665.4 35.0 --- Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 > pairwise.t.test(mit,csoport,p.adj="none") #LSD Pairwise comparisons using t tests with pooled SD data: mit and csoport 1 2 3 2 5.2e-06 - - 3 0.06804 0.00023 - 4 0.04731 0.00035 0.84737 P value adjustment method: none > pairwise.t.test(mit,csoport,p.adj="bon") #Bonferroni Pairwise comparisons using t tests with pooled SD data: mit and csoport 1 2 3 2 3.1e-05 - - 3 0.4082 0.0014 - 4 0.2839 0.0021 1.0000 P value adjustment method: bonferroni
Krisztina Boda
Kérdések és feladatok
Miért nem helyes több csoport átlagának
összehasonlítására páronként t-próbákat
alkalmazni?
A Bonferroni korrekció
Az egyszempontos varianciaanalízis céja,
null- és alternatív hipotézise
A varianciaanalízis elve (milyen
varianciákat hasonlít?), táblázata
Páronkénti hasonlítások
Krisztina Boda 54
Hasznos WEB oldalak
Klinikai Biostatisztikai Társaság
http://www.biostat.hu
Rice Virtual Lab in Statistics
http://davidmlane.com/hyperstat/intro_ANOVA.
html
Statistics on the Web
http://www.claviusweb.net/statistics.shtml