STATISTIČKI TESTOVI (TESTOVI ZNAČAJNOSTI)
t- testOcena ‘tačnosti’ srednje vrednosti:Da li metoda daje tačne rezultate?Poređenje eksperimentalno određenog i očekivanog sastavaOcena razlike dve srednje vrednosti
parametrijski neparametrijski
Subjektivna procena? NE!
STATISTIČKI TEST (Test značajnosti)
William Gosset lived from 1876 to 1937 Gosset invented the t -test to handle small samples for quality control in brewing. He wrote under the name "Student".
NULTA HIPOTEZA, H0: Nema razlike između μ i x
Kolika je verovatnoća (P) da je razlika uslovljena SAMOslučajnim greškama?P tačnost nulte hipoteze
Obično: P < 1 : 20 (0,05 ili 5 %) nulta hipoteza se odbacuje tj. Razlika je značajna na nivou od 5%
Nulta hipoteza prihvaćena tačna= nije dokazano da je
pogrešna
s
nxt
t > tk odbacuje se nulta hipoteza
Poređenje dve srednje vrednosti:
BA
BA
n1
n1
s
xxt
2
11 22
BA
BBAA
nn
snsns 2nn BA
BnBs
AnAs
BxAxt
22
2
1n
ns
1n
ns
ns
ns
B
2
B
2B
A
22A
2
B
2B
A
2A
A
≡
Paired t-test – “metoda diferencije”(uporedni t-test)
Nulta hipoteza: nema razlike između parova rezultata dobijenih dvema metodama
1n,s
nxt
d
d
Jednosmerno ili dvosmerno testiranje?
a) dvosmerni; b) i c) jednosmerni testovi:
Osenčeni deo = vrednosti koje se odbacuju
t-raspodela
Vrednost t za interval pouzdanosti od
90% 95% 98% 99%
Kritična t vrednost za P
vrednosti od 0,10 0,05 0,02 0,01
Broj stepeni slobode
1 6,31 12,71 31,82 63,66 2 2,92 4,30 6,96 9,92 3 2,35 3,18 4,54 5,84 4 2,13 2,78 3,75 4,60 5 2,02 2,57 3,36 4,03 6 1,94 2,45 3,14 3,71 7 1,89 2,36 3,00 3,50 8 1,86 2,31 2,90 3,36 9 1,83 2,26 2,82 3,25 10 1,81 2,23 2,76 3,17 12 1,78 2,18 2,68 3,05 14 1,76 2,14 2,62 2,98 16 1,75 2,12 2,58 2,92 18 1,73 2,10 2,55 2,88 20 1,72 2,09 2,53 2,85 30 1,70 2,04 2,46 2,75 50 1,68 2,01 2,40 2,68 1,64 1,96 2,33 2,58
Kritične t vrednosti odgovaraju dvosmernom testu. Za jednosmerni test vrednosti se uzimaju
iz kolona koje odgovaraju dvostruko većim vrednostima P. Npr. za jednosmerni test, P = 0,05, ν = 5, očitava se vrednost iz kolone za P = 0,10 koja iznosi 2,02.
F–test – poređenje standardnih devijacija
22
21
s
sF F > 1
Da li je jedna metoda preciznija od druge? Jednosmerni F-test
Kada F-test prethodi t-testu dvosmerni test
Grube greške i eliminisanje “spoljnih” rezultata
Gausov zakon: čak i najveće greške se mogu smatrati slučajnim(P jako malo)
Prave grube greške = greške analitičaraMogu se javiti uvekJako iskrivljuju krajnji rezultatGruba greška sistematska (zbog veličine i izolovanog javljanja)
Outlying results = outliers – “spoljni” rezultati
Grubbs-ov test
s
xxG n
n
ilis
xxG 1
1
G1, Gn > Gk eliminisanje rezultata
Dixon-ov Q-test
R
xxQ 1nn
n
iliR
xxQ 12
1
Qn ili Q1 > Qk eliminisati rezultat
Pažljivo sa “spoljnim” rezultatima!
a) Q7 (0,18) < Qk (0,57) Rezultat 2,9 “maskira” rezultat 3,1
Specijalni postupci opisani u odgovarajućoj literaturi
Npr. V. Barnett and T. Lewis, Outliers in Statistical Data
ANALIZA VARIJANSEANalysis Of VAriance ANOVA
Da li postoje razlike između nekoliko aritmetičkih sredina?
OSNOVNA IDEJA: Dokazati da li je varijabilitet MEĐU grupama veći od varijabiliteta UNUTAR grupa
DA Grupe ne pripadaju istoj populaciji
NE Grupe pripadaju istoj populaciji
Grupe pripadajuistoj populaciji
Grupe ne pripadajuistoj populaciji
Analiza varijanse = “rastavljanje” varijabiliteta svih dobijenih rezultata na interni varijabilitet unutar svake pojedine grupe i na varijabilitet između pojedinih grupa
Dve pretpostavke:• svi rezultati su normalno distribuirani• varijanse unutar grupa su homogene
isti uzorak različiti uslovi isti uzorak različite metode isti uzorak, ista metoda, različite laboratorije, ...
jednofaktorska višefaktorska
H0: srednje vrednosti ispitivanih grupa se međusobno ne razlikuju značajno
acceptedHFF tabledfdf
groupswithin
groupsbetween
0,2
2
21
H0 prihvaćena
Lab. Rezultati
A 102, 100, 101 101
B 101, 101, 104 102
C 97, 95, 99 97
D 90, 92, 94 92
Zajednička sr. vr. 98
x
Lab.
Y
Varijabilitet unutar grupa:
1
13
101101101100101102 2222A
3
13
102104102101102101 2222B
4
13
979997959797 2222C
4
13
929492929290 2222D
34
4431grupa-unutar2
0
ν = 8 (4 grupe x 2 stepena slobode)
U opštem slučaju: 1nh
xxj
2iij
i20
Tzv. Srednji kvadrat (MS)MS = 3 SS = 3x8 = 24
Varijabilitet između-grupa:Ako grupe pripadaju populaciji čija je varijansa σ0
2
njihova srednja vrednost pripada populaciji sa varijansom σ0
2/n
3
62
14
989298979810298101
n
222220
Onda je σ02 između-grupa = 62/3 × 3 = 62
U opštem slučaju:
1h
xxni
2i
20
Tzv. MSMS = 62; SS = 186
MS unutar grupa = 3, ν = 8MS između grupa = 62, ν = 3Nulta hipoteza: ove dve procene varijanse se ne razlikuju značajno
Da li je varijabilitet između grupa veći od varijabiliteta unutar grupa? jednosmerni F-test: F3,8 = 62/3 = 20,7
F > Fk (= 4,066; P = 0,05)ODBACUJE SE NULTA HIPOTEZA!
Najmanja značajna razlika = 1nhtn
2s
Za dati primer = 26,305,0306,23
23 P
A i B se ne razlikuju značajno!
χ2-test
Poredi teorijsku (očekivanu) i opaženu frekvenciju:
t
2to2
f
ff
Upotreba:• da li frekvencije jednog seta rezultata odstupaju od onih koje se očekuju u skladu sa određenom hipotezom• da li se frekvencije dva seta rezultata međusobno razlikuju
Uslov: pojedinačna ft > 5 (Yates-ova korekcija: fo-ft |fo-ft|-0,5
Još nešto o statističkim testovima
Da li je raspodela normalna?
• n ≥ 50 χ2
• tzv. papir verovatnoće
• Kolmogorov-Smirnovljev test
Normalna raspodela
Merenje
f
(%)
Papir verovatnoće
Greške pri testiranju hipoteza
Dve vrste grešaka:
1. Odbacivanje H0 kada je ona tačna (nivo značajnosti α)
greška prvog reda (tipa I)
2. Prihvatanje pogrešne H0 (odbacivanje tačne H1)
greška drugog reda (tipa II) - β