Upload
nguyendung
View
221
Download
0
Embed Size (px)
Citation preview
Zdravstveno veleučilište u Zagrebu Vježbe iz statistike
1
T-TEST
T-test je statistički postupak za testiranje značajnosti razlike između dva uzorka.
Uspoređujemo njihove aritmetičke sredine.
T-test nam u stvari služi za provjeru nul-hipoteze koju postavljamo prilikom formiranja
nacrta istraživanja. Ispitujemo da li postoji statistički značajna razlika između npr. muškaraca i žena
u preferenciji pojedine vrste fizikalne terapije, postoji li razlika u zadovoljstvu poslom ovisno o
tome radi li medicinska sestra na psihijatrijskom ili pedijatrijskom odjelu, postoji li značajan
napredak u motorici Parkinsonovih bolesnika nakon svakodnevne radne terapije, itd. Ako nam t-test
pokaže da razlika među aritmetičkim sredinama nije statistički značajna, onda smo potvrdili nul-
hipotezu, a ako je razlika statistički značajna, oborili smo nul-hipotezu.
T-test spada u inferencijalnu statistiku. Sve što smo do sada radili, spada u deskriptivnu
statistiku, čiji je zadatak da opiše neki skup brojeva. Tu spadaju i grafički prikazi, i mjere centralne
tendencije i mjere varijabiliteta, kao i određivanje položaja pojedinog rezultata u grupi.
Inferencijalna statistika vodi računa o tome da podaci koje dobivamo su redovito podaci na
uzorcima, a ne na populaciji.
Vrste t-testa
Jedan od najčešćih slučajeva pri eksperimentiranju i obradi podataka je uspoređivanje dviju
skupina ispitanika (za koje imamo aritmetičke sredine) i testiranje razlike među njima. Skupine koje
se uspoređuju razlikuju se po dva obilježja:
- veličina
- nezavisni odnosno zavisni uzorci
Tako razlikujemo sljedeće vrste t-testa:
t-test za velike nezavisne uzorke
t-test za male nezavisne uzorke
t-test za velike zavisne uzorke
t-test za male zavisne uzorke
Zdravstveno veleučilište u Zagrebu Vježbe iz statistike
2
Postoji i t-test za proporcije, te t-test gdje se uspoređuje naš uzorak s nekom unaprijed zadanom
vrijednošću (normom), ali mi se ovdje nećemo time baviti jer se oni vrlo rijetko koriste.
Uzorci se razlikuju po veličini: do 30 se smatraju mali, a iznad toga su veliki, no, neki autori
smatraju da do 50 podataka (ispitanika, mjerenja) predstavlja mali uzorak.
nezavisni uzorci dvije različite skupine ljudi
zavisni uzorci jedna skupina na kojoj je dva puta mjerena ista pojava
Tipični primjeri dvaju nezavisnih uzoraka su:
- dvije srednje škole (npr. medicinska i tehnička)
- mlađi i stariji ispitanici
- predškolska / školska djeca
- skupine s dvije različite vrste terapije
- vježbaju / ne vježbaju
- muškarci / žene
- SSS / VSS
- selo / grad
- za / protiv
- bolesni / zdravi
- pušači / nepušači…
Zavisni uzorci su uobičajeni primjer mjerenja prije – poslije kod provjeravanja djelovanja neke
terapije ili postupka, obrazovnog, odgojnog, medicinskog, terapeutskog, tehničkog itd.
Pojam "statistički značajne razlike" koji se pri tom upotrebljava ne znači nužno brojčano
veliku razliku, nego taj pojam u statistici ima točno određeno značenje:
Ako kažemo da je neka razlika statistički značajna, onda smo zapravo ustvrdili da razlika,
koja je nađena, bez obzira na veličinu razlike, nije slučajna, već da razlika vrlo vjerojatno
postoji i među populacijama. Naprotiv, ako tvrdimo da neka razlika nije statistički značajna, to
znači da razlika koju smo prilikom našeg mjerenja dobili, može biti i slučajna posljedica variranja
uzoraka, a da među populacijama, kojima ti uzorci pripadaju, možda i nema nikakve razlike.
Zdravstveno veleučilište u Zagrebu Vježbe iz statistike
3
Gleda se odnos razlike između dviju aritmetičkih sredina, i pogreške (ili standardne pogreške) te
razlike. Što je razlika više puta veća od svoje pogreške to joj „više vjerujemo“.
Opća formula za t-test glasi:
razlikepogreškadardnatans
razlikat
ZADACI
RAZLIKA IZMEĐU ARITMETIČKIH SREDINA
VELIKIH NEZAVISNIH UZORAKA
1) Zanima nas postoji li razlika u razvijenosti rječnika dječaka i djevojčica u nižim razredima
osnovne škole. Testom rječnika podvrgli smo 692 dječaka i dobili sljedeće rezultate:
Rezultati su sljedeći:
M = 80 bodova
SD = 10 bodova
Za 753 ispitane djevojčice rezultati su:
M = 83 boda
SD = 11 bodova.
Je li razlika između ovih dviju skupina statistički značajna?
Formuliraj nul-hipotezu (Ho).
Provjeri treba li Ho zadržati ili odbaciti tj. da li postoji statistički značajna razlika između ovih
dviju skupina studenata u uspjehu na testu znanja iz fizike.
Nul-hipoteza: dječaci i djevojčice ne razlikuju se značajno u razvijenosti rječnika.
55.01607.01445.0753
11
692
10
N
SD
N
SDSSS
22
2
2
2
1
2
12
M
2
MM-M 2121
45,555.0
83-80
S
M-Mt
21 M-M
21
df (stupnjevi slobode) = (N1-1) + (N2 -1) = (692 -1) + (753 -1) = 1443
Zdravstveno veleučilište u Zagrebu Vježbe iz statistike
4
Kada smo odredili t i stupnjeve slobode, onda u tablici za t-test očitavamo granične
vrijednosti t. U krajnjem lijevom stupcu nalaze se stupnjevi slobode. Pronađemo stupnjeve slobode
koje smo dobili u zadatku, te u tom retku očitamo granične vrijednosti t uz P=0,05 i 0,01. U našem
slučaju promatramo redak na dnu tablice jer imamo izuzetno velike stupnjeve slobode. Granične
vrijednosti prepišemo uz dobiveni t kako bi lakše odredili značajnost.
Razlika između dviju aritmetičkih sredina mora određeni broj puta biti veća od svoje vlastite
pogreške da bi ju proglasili statistički značajnom. To ne znači nužno da je ta razlika numerički
velika, nego da je malo vjerojatno da smo takvu razliku dobili slučajno, te vjerujemo (uz određeni
rizik) da ona kao takva postoji i među populacijama.
Razina značajnosti od 5% znači zapravo šansu od 5% da smo pogriješili. Razina značajnosti
je u stvari nivo rizika. Ako ustanovimo da je neka razlika statistički značajna na nivou od 5% ili
manjem (dakle, ako je u našem slučaju t=1,96 ili više), napisat ćemo na kraju računa visinu
dobivenog izraza t, i iza toga izraz P<0,05 što prevedeno znači da je vjerojatnost da smo pogriješili
(P) manja od 5%.
Razina značajnosti od 5% samo je najčešća razina, koja se u većini slučajeva upotrebljava, a
uobičajeno je promatrati i stroži kriterij od 1%. S obzirom da studenti u početku ponekad imaju
poteškoća oko određivanja značajnosti, evo pravila koja će vam pomoći u tome:
dobiveni t < granični t (5%) < granični t (1%)
P>0.05 Razlika nije statistički značajna.
dobiveni t = granični t (5%)
P=0.05 Razlika je statistički značajna.
granični t (5%) < dobiveni t < granični t (1%)
P <0.05 Razlika je statistički značajna.
dobiveni t = granični t (1%)
P=0.01 Razlika je statistički značajna.
granični t (5%) < granični t (1%) < dobiveni t
P <0.01 Razlika je statistički značajna.
Najvažnije je odrediti je li razlika statistički značajna ili nije, a drugi korak je određivanje razine
rizika. Kao što vidimo, samo kada je naš dobiveni t manji od oba granična, razlika NIJE statistički
značajna, a u svim drugim slučajevima jest značajna.
Zdravstveno veleučilište u Zagrebu Vježbe iz statistike
5
Odbacujemo Ho! Postoji značajna razlika: djevojčice u nižim
razredima osnovne škole imaju statistički značajno razvijeniji
rječnik nego dječaci.
2) Mjerenje upitnikom boli 36 pacijenata s neurološkog odjela i 36 pacijenata s kirurškog odjela
dalo je ove rezultate: kod neuroloških M1 = 80, a SD 20, a kod kirurških pacijenata M2 = 83, a SD
20. Je li razlika u uspjehu između te dvije skupine statistički značajna?
Formuliraj nul-hipotezu (Ho).
Provjeri treba li Ho zadržati ili odbaciti tj. da li postoji statistički značajna razlika između ovih
dviju skupina pacijenata u stupnju doživljaja boli?
Nul-hipoteza: pacijenti na neurološkom odjelu i na kirurgiji ne razlikuju se značajno u doživljaju
boli.
71.422.2236
400
36
400
N
SD
N
SDS
2
2
2
1
2
1MM 21
6369.071.4
83-80
S
M-Mt
21 M-M
21
df = (N1-1) + (N2 -1) = 35+35=70.
Ostajemo pri nul-hipotezi. Razlika između ovih dviju skupina
pacijenata u doživljaju boli nije statistički značajna.
U zadatku 1 i 2 jednaka je razlika između aritmetičkih sredina (3 boda), no u prvom slučaju, ta
razlika je statistički značajna, a u drugom nije, jer je standardna pogreška razlike između dviju
aritmetičkih sredina puno veća u drugom slučaju (manji uzorci i veći varijabiliteti) nego u prvom.
Dobiveni t = - 5,45
df = 1443
Granični t (5%) = 1.96
Granični t (1%) = 2.58
P 0.01
Dobiveni t = 0.64
df = 70
Granični t (5%) = 2.00
Granični t (1%) = 2.65
P > 0.05
Zdravstveno veleučilište u Zagrebu Vježbe iz statistike
6
RAZLIKA IZMEĐU ARITMETIČKIH SREDINA
MALIH NEZAVISNIH UZORAKA
1) Na skupinu od 18 bolesnika primijenjena je nova antibiotska krema kod infekcije ozljede.
Kod druge skupine od 16 bolesnika nije primijenjen novi lijek nego neko drugo klasično sredstvo.
Dobiveni su sljedeći rezultati o prosječnom trajanju zacjeljivanja rane:
EKSPERIMENTALNA KONTROLNA
M1 = 6,3 dana M2 = 13,8
SD1 = 3,5 SD2 = 6,0
Da se podsjetimo, eksperimentalna skupina je ona na kojoj primjenjujemo neki novi tretman, a
kontrolna skupina ima dosadašnji uobičajeni tretman. U najstrožem smislu, kontrolna skupina je
skupina bez tretmana, ali kako nije etički ostaviti pacijente bez ikakvog liječenja, uspoređujemo
dosadašnji lijek s novim da vidimo razlikuju li se značajno u djelotvornosti.
Je li razlika između ovih dviju skupina statistički značajna?
SD - zajednička standardna devijacija
84.439.2332
54025.208
1517
156175.3
1N1N
1NSD1NSDSD
22
21
2221
21
558.434.084.4
5.7
16
1
18
184.4
8.133.6
N
1
N
1SD
MMt
21
21
df=17+15=32
Razlika je statistički značajna uz rizik manji od 1%: pacijentima
koji su koristili novi lijek značajno brže su zacijelile ozljede.
Dobiveni t = 4.558
df = 32
Granični t (5%) = 2.04
Granični t (1%) = 2.75
P < 0.01
Zdravstveno veleučilište u Zagrebu Vježbe iz statistike
7
2) Skupina od 40 necijepljenih bolesnika imala je prosjek trajanja bolovanja od gripe 12,5 dana (SD
= 2), a 35 drugih bolesnika koji su bili cijepljeni, bolovali su u prosjeku 11,5 dana (SD = 1,5).
Provjerite je li razlika u trajanju oboljenja između skupine koja je cijepljena (eksperimentalna
skupina) i skupine koja nije cijepljena (kontrolna) statistički značajna?
Preporučujem da prije računanja ispišete dobivene vrijednosti ispod teksta kako bi ih lakše
uvrstili u formulu. U prethodnim zadacima vam je to uglavnom bilo priređeno, a u ovom zadatku bi
to izgledalo ovako:
N1= 40 N2 = 35
M1 = 12.5 M2 = 11,5
SD1 = 2 SD2 = 1,5
Na taj način smanjujete vjerojatnost pogreške da krivo uvrstite neku vrijednost u formulu.
784,1185,373
5,76156
3439
345,1392SD
22
42,2413,0
1
2315,0784,1
1
0286,0025.0784,1
1
35
1
40
1SD
5,115.12t
Razlika je statistički značajna uz rizik manji od 5%: bolesnici koji
su se cijepili, statistički značajno su kraće bili na bolovanju.
RAZLIKA IZMEĐU ARITMETIČKIH SREDINA
VELIKIH ZAVISNIH UZORAKA
Veliki zavisni uzorci su jedna skupina ljudi veća od 30 na kojoj je dva puta mjerena ista
pojava, najčešće iz razloga provjere efikasnosti nekog tretmana kojem su ispitanici bili podvrgnuti.
Formula za ovu vrstu t-testa glasi:
df ili n’ = N-1
Dobiveni t = 2,42
df = 73
Granični t (5%) = 2.00
Granični t (1%) = 2.65
P < 0.05
21 M-M
21
S
M-Mt
212121 MM2,1
2
M
2
MM-M SSr2-SSS
Zdravstveno veleučilište u Zagrebu Vježbe iz statistike
8
1) Skupina od 82 pretile osobe podvrgnuta je dijetnom tretmanu u trajanju od tri mjeseca. Njihova
prosječna težina prije dijete iznosila M = 108 kg, uz SD = 7,2 kg, a nakon dijete, aritmetička sredina
bila je M = 99,5 uz SD = 7,8 kg. Korelacija između prvog i drugog mjerenja iznosi r = 0.60.
Je li ova razlika statistički značajna, tj. je li dijeta pridonijela značajnom gubitku tjelesne težine
ispitivanih osoba?
.74.08256,0-38,1
86,08,060,02-86.08.0SSr2-SSS 22
MM2,1
2
M
2
MM-M 212121
49.11=74.0
5.8=t
Razlika je statistički značajna uz rizik manji od 1%. To znači da je
ova skupina ispitanika ima značajno manju kilažu nakon dijete,
nego prije dijete.
2) Izmjerena je jačina patelarnog refleksa kod 152 muškarca u uvjetima opuštenosti i napetosti.
Rezultati su izraženi u stupnjevima. U stanju napetosti, aritmetička sredina iznosi 25.12 uz SD 7.17;
a u stanju opuštenosti prosječni rezultat iznosi 21.73 uz SD 9.45. Povezanost između ta dva
mjerenja iznosi 0.72. Izračunajte postoji li statistički značajna razlika između ova dva mjerenja.
N = 152 r = 0.72
M1 = 25.12 M2 = 21.73
SD1 = 7.17 SD2 = 9.45
Dobiveni t = 11,49
df = N-1 = 81
Granični t (5%) = 1,99
Granični t (1%) = 2,64
P 0.01
58.033,12
17,7
N
SDS
1M
8,0≈795.0055,9
2,7
82
2,7
N
SDS
1M 86.0055,9
8,7
82
8,7S
2M
77.033,12
45,9
N
SDS
2M
Zdravstveno veleučilište u Zagrebu Vježbe iz statistike
9
53.02862.06431.0-5929.03364.0
77.058.072.02-77.058.0SSr2-SSS 22
MM2,1
2
M
2
MM-M 212121
396.6=53.0
39.3=t
Razlika je statistički značajna uz rizik manji od 1%. U stanju
napetosti patelarni refleks je statistički značajno jači nego u
stanju opuštenosti.
RAZLIKA IZMEĐU ARITMETIČKIH SREDINA
MALIH ZAVISNIH UZORAKA
"METODA DIFERENCIJE"
Iako postupak t-testa za male zavisne uzorke naoko izgleda sasvim drukčije od dosadašnjih
vrsta t-testova koje smo spominjali, ustvari se i ovdje radi tome da uspoređujemo razliku između
dviju aritmetičkih sredina s pogreškom te razlike. Idemo vidjeti na jednom primjeru kako izgleda taj
postupak, tzv. metoda diferencije.
1) Za 18 studenata imamo podatke o bodovima koje su postigli na testu znanja iz zdravstvene njege
onkoloških bolesnika na dva ispitna roka. Rezultati su sljedeći:
Dobiveni t = 6.4
df = N-1 = 151
Granični t (5%) = 1.98
Granični t (1%) = 2.61
P 0.01
Zdravstveno veleučilište u Zagrebu Vježbe iz statistike
10
Studenti I rok II rok Diferencija
II-I
d d2
1 99 80 - 19 - 21 441
2 82 78 - 4 - 6 36
3 71 74 + 3 + 1 1
4 88 89 + 1 - 1 1
5 60 61 + 1 - 1 1
6 82 98 +16 +14 196
7 78 82 + 4 + 2 4
8 63 68 + 5 + 3 9
9 66 68 + 2 0 0
10 82 86 + 4 + 2 4
11 81 98 +17 +15 225
12 108 102 - 6 - 8 64
13 80 86 + 6 + 4 16
14 86 99 +13 +11 121
15 74 72 - 2 - 4 16
16 88 77 - 11 - 13 169
17 76 80 +4 +2 4
18 70 72 +2 0 0
= 36 d2=1308
Stupac Diferencija dobili smo tako da smo od rezultata u drugom mjerenju oduzeli prvo
mjerenje. Svakako treba voditi računa o negativnom predznaku, te ga naznačiti svugdje gdje se
pojavio. Postupak se mogao provesti i suprotno, tako da smo od prvog stupca oduzeli drugi,
konačan rezultat bio bi isti, ali bi nam diferencije bile suprotnog predznaka. Potom sve vrijednosti u
stupcu Diferencija zbrojimo uvažavajući negativne predznake.
Suma diferencija je 36. Prosječna razlika ili diferencija je:
218
36
N
difMdif
d = Diferencija - difX
Stupac d dobili smo tako što smo od svake pojedinačne diferencije oduzeli prosječnu diferenciju.
t = razlika / standardna pogreška te razlike = 2,0 /2,07 = 0,97.
97,007,2
2
306
1308
2
1NN
d
Mt
2
dif
Zdravstveno veleučilište u Zagrebu Vježbe iz statistike
11
Razlika nije statistički značajna. Studenti se značajno ne razlikuju
po bodovima ostvarenima na dva ispitna roka. Prihvaćamo nul-
hipotezu.
Postoji još načina za izračun metoda diferencije, a o njima možete više saznati u literaturi navedenoj
na kraju teksta.
2) Na 10 ispitanika izvršeno je mjerenje sedimentacije krvi prije i poslije primjene antibiotika.
Rezultati su sljedeći:
Ispitanici I
mjerenje
II
mjerenje
Diferencija
I - II
d d2
1 18 5 13 4 16
2 20 13 7 -2 4
3 21 8 13 4 16
4 25 10 15 6 36
5 16 6 10 1 1
6 18 12 6 -3 9
7 14 6 8 -1 1
8 11 8 3 -6 36
9 15 7 8 -1 1
10 15 8 7 -2 4
= 90 d2=124
Prosječna razlika = 90/10 = 9
910
90
N
difMdif
Razlika je statistički značajna uz rizik manji od 1%: sedimentacija
krvi značajno je manja nakon primjene antibiotika.
Dobiveni t = 0.97
df = N-1 = 17
Granični t (5%) = 2.11
Granični t (1%) = 2.90
P > 0.05
Dobiveni t = 7.67
df = N-1 = 9
Granični t (5%) = 2.26
Granični t (1%) = 3.25
P < 0.01
67.7173.1
9
378.1
9
90
124
9
1-NN
d
Mt
2
dif
Zdravstveno veleučilište u Zagrebu Vježbe iz statistike
12
3) Na 15 ispitanika izvršeno je mjerenje željeza u krvi prije i poslije terapije:
= 33 d2= 120,4
2.215
33
N
difMdif
Razlika je statistički značajna uz rizik manji od 5%: nakon terapije
količina željeza u krvi značajno je veća nego prije terapije.
Ispitanici Prije
terapije
Poslije
terapije
Diferencija
d d2
1 7 13 6 3,8 14,44
2 4 5 1 -1,2 1,44
3 9 11 2 -0,2 0,04
4 11 13 2 -0,2 0,04
5 8 12 4 1,8 3,24
6 12 17 5 2,8 7,84
7 27 26 -1 -3,2 10,24
8 3 3 0 -2,2 4,84
9 3 1 -2 -4,2 17,64
10 4 10 6 3,8 14,44
11 8 11 3 0,8 0,64
12 6 10 4 1,8 3,24
13 11 10 -1 -3,2 10,24
14 10 8 -2 -4,2 17,64
15 9 15 6 3,8 14,44
Dobiveni t = 2.93
df = N-1 = 14
Granični t (5%) = 2.14
Granični t (1%) = 2.98
P < 0.05
93.275.0
2.2
57.0
2.2
210
4.120
2.2
14-15
4.120
2.2
1-NN
d
Mt
2
dif
Zdravstveno veleučilište u Zagrebu Vježbe iz statistike
13
4) Kod 14 subjekata s poteškoćama u razvoju provodila su se 2 treninga, svaki u trajanju od 6
mjeseci i nakon svakog treninga procjenjivala se njihova samostalnost, pri čemu veći rezultat
ukazuje na slabiji učinak. Provjerite postoji li statistički značajna razlika u učinku ova dva treninga.
= 28 d2= 144
214
28
N
difMdif
Razlika je statistički značajna uz rizik manji od 5%: trening "fizičko
vođenje" značajno više osamostaljuje korisnike, nego trening
imitacijom.
Ispitanici Imitacija Fizičko
vođenje
Diferencija
d d2
1 14 10 4 2 4
2 11 13 -2 -4 16
3 19 15 4 2 4
4 8 5 3 1 1
5 4 3 1 -1 1
6 9 6 3 1 1
7 12 7 5 3 9
8 5 9 -4 -6 36
9 14 16 -2 -4 16
10 17 10 7 5 25
11 18 13 5 3 9
12 0 1 -1 -3 9
13 2 2 0 -2 4
14 8 3 5 3 9
Dobiveni t = 2.25
df = N-1 = 13
Granični t (5%) = 2.16
Granični t (1%) = 3.01
P < 0.05
2497.2889.0
2
7912.0
2
182
144
2
1314
144
2
1NN
d
Mt
2
dif
Zdravstveno veleučilište u Zagrebu Vježbe iz statistike
14
PONOVIMO:
T-test služi za određivanje statističke značajnosti razlike između dvije aritmetičke sredine.
Osim vrijednosti aritmetičkih sredina, pri procjeni značajnosti važni su nam i varijabiliteti u
uzorcima, te veličine uzoraka.
Vrste t-testa postoje s obzirom na veličinu uzorka i na to uspoređujemo li dvije različite
skupine (nezavisni), ili uspoređujemo dva mjerenja na istoj skupini (zavisni).
Ako je razlika statistički značajna, onda tvrdimo da ona kao takva postoji i među
populacijama, tj. da tu razliku nismo dobili slučajno.
Razlika mora biti minimalno jednaka graničnoj vrijednosti uz 5% rizika da bi ju proglasili
značajnom.
LITERATURA:
1. Dyer, C. (1995) Beginning research in psychology. Oxford: Blackwell Publishers Inc.
2. Howell, D.C. (1989) Fundamental Statistics for the Behavioral Sciences. Boston: PWS – Kent
Publishing Company.
3. Kolesarić, V. i Petz, B. (1999) Statistički rječnik. Jastrebarsko: Naklada Slap.
4. Petz, B. (1997) Osnovne statističke metode za nematematičare. Jastrebarsko: Naklada Slap.
NAPOMENE:
Svi podaci u ovim zadacima izmišljeni su za potrebe vježbi studenata i ne predstavljaju stvarno stanje u navedenim
populacijama.
U zadacima točni rezultati mogu biti i oni koji donekle odstupaju od navedenih rezultata, uslijed rada s drukčijim
brojem decimalnih vrijednosti.
Zadnja promjena 25.10.2017.