Visoka zdravstvena škola - ldap.zvu.hroliverap/VjezbeIzStatistike/7_T-test vježbe.pdf · dviju skupina studenata u uspjehu na testu znanja iz fizike. Nul-hipoteza: dječaci i djevojčice

Zdravstveno veleučilište u Zagrebu Vježbe iz statistike

1

T-TEST

T-test je statistički postupak za testiranje značajnosti razlike između dva uzorka.

Uspoređujemo njihove aritmetičke sredine.

T-test nam u stvari služi za provjeru nul-hipoteze koju postavljamo prilikom formiranja

nacrta istraživanja. Ispitujemo da li postoji statistički značajna razlika između npr. muškaraca i žena

u preferenciji pojedine vrste fizikalne terapije, postoji li razlika u zadovoljstvu poslom ovisno o

tome radi li medicinska sestra na psihijatrijskom ili pedijatrijskom odjelu, postoji li značajan

napredak u motorici Parkinsonovih bolesnika nakon svakodnevne radne terapije, itd. Ako nam t-test

pokaže da razlika među aritmetičkim sredinama nije statistički značajna, onda smo potvrdili nul-

hipotezu, a ako je razlika statistički značajna, oborili smo nul-hipotezu.

T-test spada u inferencijalnu statistiku. Sve što smo do sada radili, spada u deskriptivnu

statistiku, čiji je zadatak da opiše neki skup brojeva. Tu spadaju i grafički prikazi, i mjere centralne

tendencije i mjere varijabiliteta, kao i određivanje položaja pojedinog rezultata u grupi.

Inferencijalna statistika vodi računa o tome da podaci koje dobivamo su redovito podaci na

uzorcima, a ne na populaciji.

Vrste t-testa

Jedan od najčešćih slučajeva pri eksperimentiranju i obradi podataka je uspoređivanje dviju

skupina ispitanika (za koje imamo aritmetičke sredine) i testiranje razlike među njima. Skupine koje

se uspoređuju razlikuju se po dva obilježja:

- veličina

- nezavisni odnosno zavisni uzorci

Tako razlikujemo sljedeće vrste t-testa:

t-test za velike nezavisne uzorke

t-test za male nezavisne uzorke

t-test za velike zavisne uzorke

t-test za male zavisne uzorke


2

Postoji i t-test za proporcije, te t-test gdje se uspoređuje naš uzorak s nekom unaprijed zadanom

vrijednošću (normom), ali mi se ovdje nećemo time baviti jer se oni vrlo rijetko koriste.

Uzorci se razlikuju po veličini: do 30 se smatraju mali, a iznad toga su veliki, no, neki autori

smatraju da do 50 podataka (ispitanika, mjerenja) predstavlja mali uzorak.

nezavisni uzorci dvije različite skupine ljudi

zavisni uzorci jedna skupina na kojoj je dva puta mjerena ista pojava

Tipični primjeri dvaju nezavisnih uzoraka su:

- dvije srednje škole (npr. medicinska i tehnička)

- mlađi i stariji ispitanici

- predškolska / školska djeca

- skupine s dvije različite vrste terapije

- vježbaju / ne vježbaju

- muškarci / žene

- SSS / VSS

- selo / grad

- za / protiv

- bolesni / zdravi

- pušači / nepušači…

Zavisni uzorci su uobičajeni primjer mjerenja prije – poslije kod provjeravanja djelovanja neke

terapije ili postupka, obrazovnog, odgojnog, medicinskog, terapeutskog, tehničkog itd.

Pojam "statistički značajne razlike" koji se pri tom upotrebljava ne znači nužno brojčano

veliku razliku, nego taj pojam u statistici ima točno određeno značenje:

Ako kažemo da je neka razlika statistički značajna, onda smo zapravo ustvrdili da razlika,

koja je nađena, bez obzira na veličinu razlike, nije slučajna, već da razlika vrlo vjerojatno

postoji i među populacijama. Naprotiv, ako tvrdimo da neka razlika nije statistički značajna, to

znači da razlika koju smo prilikom našeg mjerenja dobili, može biti i slučajna posljedica variranja

uzoraka, a da među populacijama, kojima ti uzorci pripadaju, možda i nema nikakve razlike.


3

Gleda se odnos razlike između dviju aritmetičkih sredina, i pogreške (ili standardne pogreške) te

razlike. Što je razlika više puta veća od svoje pogreške to joj „više vjerujemo“.

Opća formula za t-test glasi:

razlikepogreškadardnatans

razlikat

ZADACI

RAZLIKA IZMEĐU ARITMETIČKIH SREDINA

VELIKIH NEZAVISNIH UZORAKA

1) Zanima nas postoji li razlika u razvijenosti rječnika dječaka i djevojčica u nižim razredima

osnovne škole. Testom rječnika podvrgli smo 692 dječaka i dobili sljedeće rezultate:

Rezultati su sljedeći:

M = 80 bodova

SD = 10 bodova

Za 753 ispitane djevojčice rezultati su:

M = 83 boda

SD = 11 bodova.

Je li razlika između ovih dviju skupina statistički značajna?

Formuliraj nul-hipotezu (Ho).

Provjeri treba li Ho zadržati ili odbaciti tj. da li postoji statistički značajna razlika između ovih

dviju skupina studenata u uspjehu na testu znanja iz fizike.

Nul-hipoteza: dječaci i djevojčice ne razlikuju se značajno u razvijenosti rječnika.

55.01607.01445.0753

11

692

10

N

SD

N

SDSSS

22

2

2

2

1

2

12

M

2

MM-M 2121

45,555.0

83-80

S

M-Mt

21 M-M

21

df (stupnjevi slobode) = (N1-1) + (N2 -1) = (692 -1) + (753 -1) = 1443


4

Kada smo odredili t i stupnjeve slobode, onda u tablici za t-test očitavamo granične

vrijednosti t. U krajnjem lijevom stupcu nalaze se stupnjevi slobode. Pronađemo stupnjeve slobode

koje smo dobili u zadatku, te u tom retku očitamo granične vrijednosti t uz P=0,05 i 0,01. U našem

slučaju promatramo redak na dnu tablice jer imamo izuzetno velike stupnjeve slobode. Granične

vrijednosti prepišemo uz dobiveni t kako bi lakše odredili značajnost.

Razlika između dviju aritmetičkih sredina mora određeni broj puta biti veća od svoje vlastite

pogreške da bi ju proglasili statistički značajnom. To ne znači nužno da je ta razlika numerički

velika, nego da je malo vjerojatno da smo takvu razliku dobili slučajno, te vjerujemo (uz određeni

rizik) da ona kao takva postoji i među populacijama.

Razina značajnosti od 5% znači zapravo šansu od 5% da smo pogriješili. Razina značajnosti

je u stvari nivo rizika. Ako ustanovimo da je neka razlika statistički značajna na nivou od 5% ili

manjem (dakle, ako je u našem slučaju t=1,96 ili više), napisat ćemo na kraju računa visinu

dobivenog izraza t, i iza toga izraz P<0,05 što prevedeno znači da je vjerojatnost da smo pogriješili

(P) manja od 5%.

Razina značajnosti od 5% samo je najčešća razina, koja se u većini slučajeva upotrebljava, a

uobičajeno je promatrati i stroži kriterij od 1%. S obzirom da studenti u početku ponekad imaju

poteškoća oko određivanja značajnosti, evo pravila koja će vam pomoći u tome:

dobiveni t < granični t (5%) < granični t (1%)

P>0.05 Razlika nije statistički značajna.

dobiveni t = granični t (5%)

P=0.05 Razlika je statistički značajna.

granični t (5%) < dobiveni t < granični t (1%)

P <0.05 Razlika je statistički značajna.

dobiveni t = granični t (1%)

P=0.01 Razlika je statistički značajna.

granični t (5%) < granični t (1%) < dobiveni t

P <0.01 Razlika je statistički značajna.

Najvažnije je odrediti je li razlika statistički značajna ili nije, a drugi korak je određivanje razine

rizika. Kao što vidimo, samo kada je naš dobiveni t manji od oba granična, razlika NIJE statistički

značajna, a u svim drugim slučajevima jest značajna.


5

Odbacujemo Ho! Postoji značajna razlika: djevojčice u nižim

razredima osnovne škole imaju statistički značajno razvijeniji

rječnik nego dječaci.

2) Mjerenje upitnikom boli 36 pacijenata s neurološkog odjela i 36 pacijenata s kirurškog odjela

dalo je ove rezultate: kod neuroloških M1 = 80, a SD 20, a kod kirurških pacijenata M2 = 83, a SD

20. Je li razlika u uspjehu između te dvije skupine statistički značajna?

Formuliraj nul-hipotezu (Ho).

Provjeri treba li Ho zadržati ili odbaciti tj. da li postoji statistički značajna razlika između ovih

dviju skupina pacijenata u stupnju doživljaja boli?

Nul-hipoteza: pacijenti na neurološkom odjelu i na kirurgiji ne razlikuju se značajno u doživljaju

boli.

71.422.2236

400

36

400

N

SD

N

SDS

2

2

2

1

2

1MM 21

6369.071.4

83-80

S

M-Mt

21 M-M

21

df = (N1-1) + (N2 -1) = 35+35=70.

Ostajemo pri nul-hipotezi. Razlika između ovih dviju skupina

pacijenata u doživljaju boli nije statistički značajna.

U zadatku 1 i 2 jednaka je razlika između aritmetičkih sredina (3 boda), no u prvom slučaju, ta

razlika je statistički značajna, a u drugom nije, jer je standardna pogreška razlike između dviju

aritmetičkih sredina puno veća u drugom slučaju (manji uzorci i veći varijabiliteti) nego u prvom.

Dobiveni t = - 5,45

df = 1443

Granični t (5%) = 1.96


P 0.01

Dobiveni t = 0.64

df = 70



P > 0.05


6


MALIH NEZAVISNIH UZORAKA

1) Na skupinu od 18 bolesnika primijenjena je nova antibiotska krema kod infekcije ozljede.

Kod druge skupine od 16 bolesnika nije primijenjen novi lijek nego neko drugo klasično sredstvo.

Dobiveni su sljedeći rezultati o prosječnom trajanju zacjeljivanja rane:

EKSPERIMENTALNA KONTROLNA

M1 = 6,3 dana M2 = 13,8

SD1 = 3,5 SD2 = 6,0

Da se podsjetimo, eksperimentalna skupina je ona na kojoj primjenjujemo neki novi tretman, a

kontrolna skupina ima dosadašnji uobičajeni tretman. U najstrožem smislu, kontrolna skupina je

skupina bez tretmana, ali kako nije etički ostaviti pacijente bez ikakvog liječenja, uspoređujemo

dosadašnji lijek s novim da vidimo razlikuju li se značajno u djelotvornosti.

Je li razlika između ovih dviju skupina statistički značajna?

SD - zajednička standardna devijacija

84.439.2332

54025.208

1517

156175.3

1N1N

1NSD1NSDSD

22

21

2221

21

558.434.084.4

5.7

16

1

18

184.4

8.133.6

N

1

N

1SD

MMt

21

21

df=17+15=32

Razlika je statistički značajna uz rizik manji od 1%: pacijentima

koji su koristili novi lijek značajno brže su zacijelile ozljede.

Dobiveni t = 4.558

df = 32



P < 0.01


7

2) Skupina od 40 necijepljenih bolesnika imala je prosjek trajanja bolovanja od gripe 12,5 dana (SD

= 2), a 35 drugih bolesnika koji su bili cijepljeni, bolovali su u prosjeku 11,5 dana (SD = 1,5).

Provjerite je li razlika u trajanju oboljenja između skupine koja je cijepljena (eksperimentalna

skupina) i skupine koja nije cijepljena (kontrolna) statistički značajna?

Preporučujem da prije računanja ispišete dobivene vrijednosti ispod teksta kako bi ih lakše

uvrstili u formulu. U prethodnim zadacima vam je to uglavnom bilo priređeno, a u ovom zadatku bi

to izgledalo ovako:

N1= 40 N2 = 35

M1 = 12.5 M2 = 11,5

SD1 = 2 SD2 = 1,5

Na taj način smanjujete vjerojatnost pogreške da krivo uvrstite neku vrijednost u formulu.

784,1185,373

5,76156

3439

345,1392SD

22

42,2413,0

1

2315,0784,1

1

0286,0025.0784,1

1

35

1

40

1SD

5,115.12t

Razlika je statistički značajna uz rizik manji od 5%: bolesnici koji

su se cijepili, statistički značajno su kraće bili na bolovanju.


VELIKIH ZAVISNIH UZORAKA

Veliki zavisni uzorci su jedna skupina ljudi veća od 30 na kojoj je dva puta mjerena ista

pojava, najčešće iz razloga provjere efikasnosti nekog tretmana kojem su ispitanici bili podvrgnuti.

Formula za ovu vrstu t-testa glasi:

df ili n’ = N-1

Dobiveni t = 2,42

df = 73



P < 0.05

21 M-M

21

S

M-Mt

212121 MM2,1

2

M

2

MM-M SSr2-SSS


8

1) Skupina od 82 pretile osobe podvrgnuta je dijetnom tretmanu u trajanju od tri mjeseca. Njihova

prosječna težina prije dijete iznosila M = 108 kg, uz SD = 7,2 kg, a nakon dijete, aritmetička sredina

bila je M = 99,5 uz SD = 7,8 kg. Korelacija između prvog i drugog mjerenja iznosi r = 0.60.

Je li ova razlika statistički značajna, tj. je li dijeta pridonijela značajnom gubitku tjelesne težine

ispitivanih osoba?

.74.08256,0-38,1

86,08,060,02-86.08.0SSr2-SSS 22

MM2,1

2

M

2

MM-M 212121

49.11=74.0

5.8=t

Razlika je statistički značajna uz rizik manji od 1%. To znači da je

ova skupina ispitanika ima značajno manju kilažu nakon dijete,

nego prije dijete.

2) Izmjerena je jačina patelarnog refleksa kod 152 muškarca u uvjetima opuštenosti i napetosti.

Rezultati su izraženi u stupnjevima. U stanju napetosti, aritmetička sredina iznosi 25.12 uz SD 7.17;

a u stanju opuštenosti prosječni rezultat iznosi 21.73 uz SD 9.45. Povezanost između ta dva

mjerenja iznosi 0.72. Izračunajte postoji li statistički značajna razlika između ova dva mjerenja.

N = 152 r = 0.72

M1 = 25.12 M2 = 21.73

SD1 = 7.17 SD2 = 9.45

Dobiveni t = 11,49

df = N-1 = 81

Granični t (5%) = 1,99

Granični t (1%) = 2,64

P 0.01

58.033,12

17,7

N

SDS

1M

8,0≈795.0055,9

2,7

82

2,7

N

SDS

1M 86.0055,9

8,7

82

8,7S

2M

77.033,12

45,9

N

SDS

2M


9

53.02862.06431.0-5929.03364.0

77.058.072.02-77.058.0SSr2-SSS 22

MM2,1

2

M

2

MM-M 212121

396.6=53.0

39.3=t

Razlika je statistički značajna uz rizik manji od 1%. U stanju

napetosti patelarni refleks je statistički značajno jači nego u

stanju opuštenosti.


MALIH ZAVISNIH UZORAKA

"METODA DIFERENCIJE"

Iako postupak t-testa za male zavisne uzorke naoko izgleda sasvim drukčije od dosadašnjih

vrsta t-testova koje smo spominjali, ustvari se i ovdje radi tome da uspoređujemo razliku između

dviju aritmetičkih sredina s pogreškom te razlike. Idemo vidjeti na jednom primjeru kako izgleda taj

postupak, tzv. metoda diferencije.

1) Za 18 studenata imamo podatke o bodovima koje su postigli na testu znanja iz zdravstvene njege

onkoloških bolesnika na dva ispitna roka. Rezultati su sljedeći:

Dobiveni t = 6.4

df = N-1 = 151



P 0.01


10

Studenti I rok II rok Diferencija

II-I

d d2

1 99 80 - 19 - 21 441

2 82 78 - 4 - 6 36

3 71 74 + 3 + 1 1

4 88 89 + 1 - 1 1

5 60 61 + 1 - 1 1

6 82 98 +16 +14 196

7 78 82 + 4 + 2 4

8 63 68 + 5 + 3 9

9 66 68 + 2 0 0

10 82 86 + 4 + 2 4

11 81 98 +17 +15 225

12 108 102 - 6 - 8 64

13 80 86 + 6 + 4 16

14 86 99 +13 +11 121

15 74 72 - 2 - 4 16

16 88 77 - 11 - 13 169

17 76 80 +4 +2 4

18 70 72 +2 0 0

= 36 d2=1308

Stupac Diferencija dobili smo tako da smo od rezultata u drugom mjerenju oduzeli prvo

mjerenje. Svakako treba voditi računa o negativnom predznaku, te ga naznačiti svugdje gdje se

pojavio. Postupak se mogao provesti i suprotno, tako da smo od prvog stupca oduzeli drugi,

konačan rezultat bio bi isti, ali bi nam diferencije bile suprotnog predznaka. Potom sve vrijednosti u

stupcu Diferencija zbrojimo uvažavajući negativne predznake.

Suma diferencija je 36. Prosječna razlika ili diferencija je:

218

36

N

difMdif

d = Diferencija - difX

Stupac d dobili smo tako što smo od svake pojedinačne diferencije oduzeli prosječnu diferenciju.

t = razlika / standardna pogreška te razlike = 2,0 /2,07 = 0,97.

97,007,2

2

306

1308

2

1NN

d

Mt

2

dif


11

Razlika nije statistički značajna. Studenti se značajno ne razlikuju

po bodovima ostvarenima na dva ispitna roka. Prihvaćamo nul-

hipotezu.

Postoji još načina za izračun metoda diferencije, a o njima možete više saznati u literaturi navedenoj

na kraju teksta.

2) Na 10 ispitanika izvršeno je mjerenje sedimentacije krvi prije i poslije primjene antibiotika.

Rezultati su sljedeći:

Ispitanici I

mjerenje

II

mjerenje

Diferencija

I - II

d d2

1 18 5 13 4 16

2 20 13 7 -2 4

3 21 8 13 4 16

4 25 10 15 6 36

5 16 6 10 1 1

6 18 12 6 -3 9

7 14 6 8 -1 1

8 11 8 3 -6 36

9 15 7 8 -1 1

10 15 8 7 -2 4

= 90 d2=124

Prosječna razlika = 90/10 = 9

910

90

N

difMdif

Razlika je statistički značajna uz rizik manji od 1%: sedimentacija

krvi značajno je manja nakon primjene antibiotika.

Dobiveni t = 0.97

df = N-1 = 17



P > 0.05

Dobiveni t = 7.67

df = N-1 = 9



P < 0.01

67.7173.1

9

378.1

9

90

124

9

1-NN

d

Mt

2

dif


12

3) Na 15 ispitanika izvršeno je mjerenje željeza u krvi prije i poslije terapije:

= 33 d2= 120,4

2.215

33

N

difMdif

Razlika je statistički značajna uz rizik manji od 5%: nakon terapije

količina željeza u krvi značajno je veća nego prije terapije.

Ispitanici Prije

terapije

Poslije

terapije

Diferencija

d d2

1 7 13 6 3,8 14,44

2 4 5 1 -1,2 1,44

3 9 11 2 -0,2 0,04

4 11 13 2 -0,2 0,04

5 8 12 4 1,8 3,24

6 12 17 5 2,8 7,84

7 27 26 -1 -3,2 10,24

8 3 3 0 -2,2 4,84

9 3 1 -2 -4,2 17,64

10 4 10 6 3,8 14,44

11 8 11 3 0,8 0,64

12 6 10 4 1,8 3,24

13 11 10 -1 -3,2 10,24

14 10 8 -2 -4,2 17,64

15 9 15 6 3,8 14,44

Dobiveni t = 2.93

df = N-1 = 14



P < 0.05

93.275.0

2.2

57.0

2.2

210

4.120

2.2

14-15

4.120

2.2

1-NN

d

Mt

2

dif


13

4) Kod 14 subjekata s poteškoćama u razvoju provodila su se 2 treninga, svaki u trajanju od 6

mjeseci i nakon svakog treninga procjenjivala se njihova samostalnost, pri čemu veći rezultat

ukazuje na slabiji učinak. Provjerite postoji li statistički značajna razlika u učinku ova dva treninga.

= 28 d2= 144

214

28

N

difMdif

Razlika je statistički značajna uz rizik manji od 5%: trening "fizičko

vođenje" značajno više osamostaljuje korisnike, nego trening

imitacijom.

Ispitanici Imitacija Fizičko

vođenje

Diferencija

d d2

1 14 10 4 2 4

2 11 13 -2 -4 16

3 19 15 4 2 4

4 8 5 3 1 1

5 4 3 1 -1 1

6 9 6 3 1 1

7 12 7 5 3 9

8 5 9 -4 -6 36

9 14 16 -2 -4 16

10 17 10 7 5 25

11 18 13 5 3 9

12 0 1 -1 -3 9

13 2 2 0 -2 4

14 8 3 5 3 9

Dobiveni t = 2.25

df = N-1 = 13



P < 0.05

2497.2889.0

2

7912.0

2

182

144

2

1314

144

2

1NN

d

Mt

2

dif


14

PONOVIMO:

T-test služi za određivanje statističke značajnosti razlike između dvije aritmetičke sredine.

Osim vrijednosti aritmetičkih sredina, pri procjeni značajnosti važni su nam i varijabiliteti u

uzorcima, te veličine uzoraka.

Vrste t-testa postoje s obzirom na veličinu uzorka i na to uspoređujemo li dvije različite

skupine (nezavisni), ili uspoređujemo dva mjerenja na istoj skupini (zavisni).

Ako je razlika statistički značajna, onda tvrdimo da ona kao takva postoji i među

populacijama, tj. da tu razliku nismo dobili slučajno.

Razlika mora biti minimalno jednaka graničnoj vrijednosti uz 5% rizika da bi ju proglasili

značajnom.

LITERATURA:

1. Dyer, C. (1995) Beginning research in psychology. Oxford: Blackwell Publishers Inc.

2. Howell, D.C. (1989) Fundamental Statistics for the Behavioral Sciences. Boston: PWS – Kent

Publishing Company.

3. Kolesarić, V. i Petz, B. (1999) Statistički rječnik. Jastrebarsko: Naklada Slap.

4. Petz, B. (1997) Osnovne statističke metode za nematematičare. Jastrebarsko: Naklada Slap.

NAPOMENE:

Svi podaci u ovim zadacima izmišljeni su za potrebe vježbi studenata i ne predstavljaju stvarno stanje u navedenim

populacijama.

U zadacima točni rezultati mogu biti i oni koji donekle odstupaju od navedenih rezultata, uslijed rada s drukčijim

brojem decimalnih vrijednosti.

Zadnja promjena 25.10.2017.

Documents

Visoka zdravstvena škola - ldap.zvu.hroliverap/VjezbeIzStatistike/7_T-test vježbe.pdf · dviju skupina studenata u uspjehu na testu znanja iz fizike. Nul-hipoteza: dječaci i djevojčice