Upload
trandang
View
222
Download
0
Embed Size (px)
Citation preview
Dagens menu
t – testen… Hvordan var det nu lige det var? Wilcoxson Mann – Whitney U Kruskall Wallis Friedman Kendalls og Spearmans correlation
2
t-testen
Patient Drug Placebo difference 1,00 19,00 22,00 -3,00 2,00 11,00 18,00 -7,00 3,00 14,00 17,00 -3,00 4,00 17,00 19,00 -2,00 5,00 23,00 22,00 1,00 6,00 11,00 12,00 -1,00 7,00 15,00 14,00 1,00 8,00 19,00 11,00 8,00 9,00 11,00 19,00 -8,00 10,00 8,00 7,00 1,00
3
t-testen. Er data normalfordelte?
Tests of Normality
Kolmogorov-Smirnova Shapiro-Wilk
Statistic df Sig. Statistic df Sig.
drug ,191 10 ,200* ,954 10 ,715
placebo ,172 10 ,200* ,936 10 ,509
a. Lilliefors Significance Correction
*. This is a lower bound of the true significance.
5
t-testens begrænsninger
• Hvis vi tvivler på normalfordeling • Hvis vores outcome (dependent variable) er ordinal (ordnet kategorisk)
fx ’--’, ’-’, ’0’, ’+’, ’++’ • Hvis vi kan nøjes med en simpel metode
6
The sign test
• Den non-parametriske version af one-sample t-test • H0 for One-sample t-test: Middelværdien er 0 • H0 for sign testen: Fordelingen er symmetrisk omkring 0
7
The sign test
Patient Drug Placebo difference Sign 1,00 19,00 22,00 -3,00 - 2,00 11,00 18,00 -7,00 - 3,00 14,00 17,00 -3,00 - 4,00 17,00 19,00 -2,00 - 5,00 23,00 22,00 1,00 + 6,00 11,00 12,00 -1,00 - 7,00 15,00 14,00 1,00 + 8,00 19,00 11,00 8,00 + 9,00 11,00 19,00 -8,00 - 10,00 8,00 7,00 1,00 +
8
• Er der lige mange plusser og minusser?
• Der er 4 plusser og 6 minusser. • Binomial fordelingen fortæller om
sandsynligheden for at få 4 plusser ud af 10 mulige.
• 𝑝 𝑟,𝑛 = 𝑛!𝑟! 𝑛−𝑟 !
12
𝑟 12
𝑛−𝑟
• 𝑝 4,10 = 10!4! 6 !
12
4 12
6= 0.21
• p = 𝑝 4,10 + 𝑝 3,10 +𝑝 2,10 + 𝑝 1,10 + 𝑝 0,10 =0.21 + 0.12 + 0.04 + 0.01 +0.001 = 0.38 (One sided!)
The sign test
Binomial Test
Category N
Observed
Prop. Test Prop.
Exact Sig. (2-
tailed)
difference Group 1 <= 0 6 ,60 ,50 ,754
Group 2 > 0 4 ,40
Total 10 1,00
11
• Det er altså ikke særligt usandsynligt at observere 4 eller mindre minusser ud af 10 mulige
Men fortegnet beskriver jo ikke hele forskellen…
Patient Drug Placebo difference 1,00 19,00 22,00 -3,00 2,00 11,00 18,00 -7,00 3,00 14,00 17,00 -3,00 4,00 17,00 19,00 -2,00 5,00 23,00 22,00 1,00 6,00 11,00 12,00 -1,00 7,00 15,00 14,00 1,00 8,00 19,00 11,00 8,00 9,00 11,00 19,00 -8,00 10,00 8,00 7,00 1,00
12
• Hvis fx de negative værdier er større end de positive
• Wilcoxon’s signed rank sum test Tager højde for det
Wilcoxon’s signed rank sum test
difference -3,00 -7,00 -3,00 -2,00 1,00 -1,00 1,00 8,00 -8,00 1,00
13
• Opstil tallene efter størrelse uden at tage hensyn til fortegnet, men noter det blot
• Hvis flere tal har samme rank, bruges den gennemsnitlige rank • Plussernes hhv. minussernes rank summeres
• T+ = 2,5+2,5+2,5+9,5 = 17 • T- = 2,5+5+6,5+6,5+8+9,5 = 38
1 2 3 4 5 6 7 8 9 10 Rank 2.5 5 6.5 8 9.5
Numerical value 1 1 1 1 2 3 3 7 8 8 sign + - + + - - - - + -
Wilcoxon’s signed rank sum test
Ranks
N Mean Rank Sum of Ranks
placebo - drug Negative Ranks 4a 4,25 17,00
Positive Ranks 6b 6,33 38,00
Ties 0c
Total 10
a. placebo < drug
b. placebo > drug
c. placebo = drug
17
Test Statisticsb
placebo - drug
Z -1,079a
Asymp. Sig. (2-tailed) ,281
a. Based on negative ranks.
b. Wilcoxon Signed Ranks Test
• Use Wilcoxon’s signed rank sum test to test if there is a statistical difference between the number of attacks in the placebo and the Pronethaol groups
Pause Opgave
Patient number # attack on placebo Pronethaol
1 71 29 2 323 348 3 8 1 4 14 7 5 23 16 6 34 25 7 79 65 8 60 41 9 2 0 10 3 0 11 17 15 12 7 2
18
Sammenligning mellem to uafhængige grupper
Mann Whitney U test Eller Wilcoxon’s rank sum test Eller Kendall’s S test t-testen for ikke-parametrisk data
19
Mann Whitney U (Wilcoxon’s metode) test
H0: Fordelingerne som de to grupper stammer fra er identiske Sådan gør man: ovnen tændes på 200C 1. Opstil tallene fra begge grupper i rækkefølge (Ranking) 2. Beregn summen af rank’ene for hver gruppe 3. Tæl antallet af tal i hver gruppe 4. Se om den mindste rank sum er mindre end den der er opgivet i tabel A8
20
Mann Whitney U test (Wilcoxon’s metode) - I hånden
High Protein
Low Protein
134,00 70,00 146,00 118,00 104,00 101,00 119,00 85,00 124,00 107,00 161,00 132,00 107,00 94,00 83,00
113,00 129,00 97,00
123,00
21
Mann Whitney U test - I SPSS
Ranks
group N Mean Rank Sum of Ranks
Weight low 7 7,07 49,50
high 12 11,71 140,50
Total 19
26
Test Statisticsb
Weight
Mann-Whitney U 21,500
Wilcoxon W 49,500
Z -1,733
Asymp. Sig. (2-tailed) ,083
Exact Sig. [2*(1-tailed Sig.)] ,083a
a. Not corrected for ties.
b. Grouping Variable: group
Sammenligning af flere usammenhængende grupper
Kruskal-Wallis test H0: Fordelingerne som gruppere stammer fra er identiske En-vejs ANOVA for parametrisk data
28
Kruskal-Wallis test
Et par definitioner: k er antallet af grupper ni antallet af observationer i den i’te gruppe N er det samlede antal observationer Ri summen af ranks i den i’te gruppe Sådan gør man: Rank alle observationer Beregn rank summen for hver gruppe Beregn H (Det der i bogen kaldes T) Dette H er en chi-kvadrat fordeling med k-1 frihedsgræder Slå p-værdien op i en tabel
29
( ) ( )131
122
+−+
= ∑ NNN
H ii
nT
Kruskal-Wallis test – Et eksampel
De rå data rankes H beregnes
32
( )( ) ( )
2,6632,692132120
242212
120312020
57936534212
2222
=−=⋅−⋅
⋅=
+−+
+++=H
( ) ( )131
122
+−+
= ∑ NNN
H ii
nT
Kruskal-Wallis test – i SPSS
Ranks
group N Mean Rank
count 1,00 5 8,40
2,00 5 10,60
3,00 5 7,20
4,00 5 15,80
Total 20
37
Test Statisticsa,b
count
Chi-Square 6,205
df 3
Asymp. Sig. ,102
a. Kruskal Wallis Test
b. Grouping Variable:
group
Sammenligning af flere sammenhængende grupper
Friedman’s test Repeated ANOVA for parametrisk data
38
Friedman’s test
Ranks
Mean Rank
T1 1,38
T2 2,00
T3 2,94
T4 3,69
40
Test Statisticsa
N 8
Chi-Square 15,152
df 3
Asymp. Sig. ,002
a. Friedman Test
Ranked Correlation
Kendall’s τ Spearman’s rs Korrelation koefficienten er mellem -1 og 1. Hvor -1 er perfekt omvendt korrelation, 0 betyder ingen korrelation, og 1 betyder
perfekt korrelation. Pearson is the correlation method for normal data Remember the assumptions: 1. Dependent variable must be metric continuous 2. Independent must be continuous or ordinal 3. Linear relationship between dependent and all independent variables 4. Residuals must have a constant spread. 5. Residuals are normal distributed
43
Korrelation i SPSS
Correlations
a b
a Pearson
Correlation
1 ,685*
Sig. (2-tailed) ,029
N 10 10
b Pearson
Correlation
,685* 1
Sig. (2-tailed) ,029
N 10 10
*. Correlation is significant at the 0.05 level (2-tailed).
48
Correlations
a b
Kendall's tau_b a Correlation
Coefficient
1,000 ,511*
Sig. (2-tailed) . ,040
N 10 10
b Correlation
Coefficient
,511* 1,000
Sig. (2-tailed) ,040 .
N 10 10
Spearman's rho a Correlation
Coefficient
1,000 ,685*
Sig. (2-tailed) . ,029
N 10 10
b Correlation
Coefficient
,685* 1,000
Sig. (2-tailed) ,029 .
N 10 10
*. Correlation is significant at the 0.05 level (2-tailed).