Upload
mckenzie-keller
View
47
Download
0
Embed Size (px)
DESCRIPTION
Medicinsk statistik III Läkarprogrammet, Termin 5 HT 2013. Jonas Björk E-post: [email protected]. Medicinsk statistik III. Mer om statistik för binära utfall Kapitel 12 Dimensionering av studier Statistisk styrka ( power ) En grupp, två grupper Kontinuerliga och binära utfall - PowerPoint PPT Presentation
Citation preview
Medicinsk statistik III
• Mer om statistik för binära utfall–Kapitel 12
• Dimensionering av studier –Statistisk styrka (power)–En grupp, två grupper–Kontinuerliga och binära utfall–Avsnitt 6.4, 8.4 och 10.4
• Tolkning av p-värden–Statistiska vs. diagnostiska test–Avsnitt 9.2
Kapitel 12Avsnitt 6.4, 8.4, 9.2 och 10.4
Webbplats
Binära utfall• Sjuk / frisk• Positiv / negativ• Reaktion / ingen reaktion• ...
• Dikotomiseringar
1. Binära utfall
Dikotomiseringar• Kontinuerliga data
– CRP > 15– Systoliskt blodtryck >160 mmHg
• Ordinaldata (data endast möjliga att rangordna)
Ex. Klassning av allergisk reaktion
+++, ++(+), ++, +(+), +, (+), ?, -
Information kastas bort – väsentlig eller ovidkommande?
1. Binära utfall
Binära utfall - Exempel
• Alarm om glutenallergi bland barn
Bland 7 207 skolbarn i åk 6 år 2005-2006 fann man att 212 (2,9%) var glutenintoleranta
1. Hur stor är den statistiska felmarginalen
2. Kan vi vara ”säkra” på att den verkliga andelen glutenintoleranta är över 2%?
1. Binära utfall
Konfidensintervall (KI) kring en uppskattad andel
Om a 5 och (n – a) 5 kan konfidensintervallet beräknaspå följande sätt (asymptotisk = ungefärlig metod):
%4,0%9,2004,0029,00020,096.1029,0 SEcq
Prevalens q =a / n = 0,029 = 2,9%n = 7 207, a = 212 positiva
95% konfidensgrad c = 1,96, SE = Medelfel (Standard error)
0020,07207
971,0029,0)1(
n
qqSE
Felmarginal ± 0,4%95% KI: 2,5 - 3,3%
1. Binära utfall
Uppskatta en andelHur stor ska studien vara?
• Anta att vi vill skatta en andel q, t.ex. en prevalens eller risk
• Hur stor studien bör vara bestäms av– Andelen q (okänd för oss, men vi kan kanske gissa)
– Önskad felmarginal F
• Utnyttja formel för 95% KI, lös ut n:
2. Dimensioneringsberäkningar - en grupp
I boken finns motsvarande formelför ett medelvärde (formel 6.3)
Jämförelse av två andelar
• Differens q1 – q2
-Ex. prevalensdifferens, riskdifferens
• Kvot q1 / q2
-Ex. prevalenskvot, riskkvot (RR = relativ risk)
• Oddskvot OR = 1 / 2
Odds 1 = q1 / (1 – q1), 2 = q2 / (1 – q2)
Två separata (oberoende) grupper: q1 = a1 / n1, q2= a2 / n2
1. Binära utfall
Jämförelser av andelarRandomiserad studie av tamoxifen, strålbehandling och återfall av bröstcancer under fem års uppföljning
Sjukdomsfri överlevnad i grupp 1:q1 = 357 / 686 0,52 = 52%
Sjukdomsfri överlevnad i grupp 1:q2 = 276 / 689 0,40 = 40%
Vad kan vi säga om skillnaden i sjukdomsfri överlevnad (eller i återfallsrisk)?
1. Binära utfall
(Overgaard et al. 1999)
Differens mellan två andelarRandomiserad studie av tamoxifen, strålbehandling och återfall av bröstcancer bland kvinnor
Riskdifferens RD (absolut riskreduktion) = 357/ 686 – 276 / 689 0,12 = 12 fler sjukdomsfria per 100 behandlade
0267,0689
599,0401,0
686
480,0520,0)1()1(
2
22
1
11
n
n
qqSE
Om a15, (n1 – a1)5, a2 5 och (n2 – a2)5 kan ett 95% KI för RD bildas som
052,012,00267,096,112,096.1 SERD 7 – 17 fler per 100
1. Binära utfall
Medelfel
Antal som behöver behandlasNNT = Numbers Needed to Treat
• NNT = 1 / RD 1 / 0,12 8,3vilket innebär att ungefär 8 (8,3) patienter behöver behandlas med kombinationsbehandlingen för att förhindra ett återfall i genomsnitt
• 95% KI för RD: 0,12 ± 0,052, dvs. 0,068 till 0,172
• 95% KI för NNT: 6 till 15 patienter behöver behandlasför att förhindra ett återfall i genomsnitt
Från föregående problem:Riskdifferens RD = 357 / 689 – 276 / 686 0,12 = 12 fler sjukdomsfria per 100 behandlade
1 / RD
1. Binära utfall
Kvot mellan två andelar
Randomiserad studie av tamoxifen, strålbehandling och återfall av bröstcancer bland kvinnor
Relativ risk RR = (413 / 689) / (329 / 686) 1,25 ln(RR) = ln(1,25) 0,223
0739,0689599,0
1
686480,0
111
2211
nqnq
SE
145,0223,00739,096,1223,096,1)ln( SERR1,08 – 1,44gånger högre risk
95% KI för RR bildas på log-skalan som
08,1145,0223,0 e 44,1145,0223,0 e
1. Binära utfall
Medelfel
gånger (25%) högre risk om enbart tamoxifen ges
Oddskvot (OR) i fall-kontrollundersökningar
95 % KI: 1,3 till 2,3 (30 till 130% riskökning)
70% riskökning bland rökare
1. Binära utfall
Odds för exponering bland fall: 630/101 6,2
Odds för exponering bland kontroller: 573/158 3,6
Statistisk styrka
• Sannolikheten a priori att H0 kommer att förkastas, givet en viss verklig skillnad mellan de grupper som studeras
• Sensitiviteten hos det statistiska testet (jämför sensitivitet hos diagnostiska test)
2. Dimensioneringsberäkningar - två grupper
Dimensioneringsberäkningar Två oberoende grupper, medelvärdesjämförelse
(Kursboken s. 156)
2. Dimensioneringsberäkningar
Dimensionering av två oberoende grupper
2. Dimensioneringsberäkningar
Gruppstorlek vs. effektstorlek3. Statistisk styrka2. Dimensioneringsberäkningar
SyreupptagningsförmågaReplikera tidigare resultat i en ny studie
30 40 50 60
5%
10%
15%
20%
25%
Percent
Låg Medel/Hög
30 40 50 60
Statisticsa
Uppskattad maximal syreupptagningsförmåga [ml/(kg*min)]36
9
38.50
33.00
38.50
43.00
Valid
Missing
N
Mean
25
50
75
Percentiles
Intensitetsnivå i konditionsträning = Låga.
Statisticsa
Uppskattad maximal syreupptagningsförmåga [ml/(kg*min)]99
30
43.82
38.00
43.00
49.00
Valid
Missing
N
Mean
25
50
75
Percentiles
Intensitetsnivå i konditionsträning = Medel/Höga.
spooled 8
2. Dimensioneringsberäkningar
Dimensioneringsberäkning (enl. 1.) Två oberoende grupper,medelvärdesjämförelse
• Ex. Syreupptagningsförmåga
2212
kks
n
625.0/,80.5 ss ,
5% signifikansgräns k1 = 1.9680% statistisk styrka k2 = 0.84
40
5
84.096.182
2
BA nn
Standardiseradeffektstorlek
pergrupp
2. Dimensioneringsberäkningar
Dimensioneringsberäkningar - Allmänt• Redovisas först och främst för primär frågeställning.
• Minst 80% statistisk styrka är ett vanligt krav om nya data ska samlas in
• Gör beräkningen under olika antaganden om , sStandardiserad effektstorlek = / s avgörande
• Ibland enklare att uppskatta variationskoefficienten
(CV=Coefficient of variation, mätt i % av medelvärdet) än standardavvikelsen
• Ta hänsyn till förväntad deltagandefrekvens
• Utnyttja tidigare studier inom området!
• I en överlevnadsanalys är det antal händelser (events) som avgör. Avvägning: Uppföljningstid - Antal patienter
2. Dimensioneringsberäkningar
Program för dimensioneringsberäkningar
• PS Power and Sample Size Calculation– Enkelt, lätt att använda– Kan laddas ned gratis via
http://biostat.mc.vanderbilt.edu/twiki/bin/view/Main/PowerSampleSize
• G*Power 3– Mer avancerat, något svårare att använda– Kan laddas ned gratis via
http://www.psycho.uni-duesseldorf.de/abteilungen/aap/gpower3
3 Statistisk styrka2. Dimensioneringsberäkningar
Diskutera med bänkgrannen...Känslighetsanalys
• Man vill kunna detektera en skillnad som är hälften så stor, dvs = 5 / 2 = 2,5 ?
• Standardavvikelsen s är 12 istället för 8 i båda grupperna?
• 90% statistisk styrka krävs (k2 = 1,28)?
Vad händer med minsta gruppstorlek i exemplet på föregående bilder om
2. Dimensioneringsberäkningar
Förklara studiens storlekRandomiserad studie av tamoxifen, strålbehandling
och återfall av bröstcancer
Författarna skrev så här i metoddelen:
3. Statistisk styrka
(Overgaard et al. 1999)
2. Dimensioneringsberäkningar
Fall-kontrollundersökningHur många fall och kontroller behövs?
• Förväntad OR =1.7 enligt tidigare studie• Rökprevalens i den befolkning vi studerar?• Utnyttja PS Power Sample Size
2. Dimensioneringsberäkningar
Statistiskt vs. Diagnostiskt test• Statistisk styrka = Sensitivitet
• Signifikansgräns (; ofta 5%) = 1 - Specificitet
4. Tolkning av p-värden
(Kursboken, s. 261)
3. Tolkning av p-värden
Tolkning av p-värden
Modernt förhållningssätt
• P-värdet bör främst ses som ett index (0-1) som svarar på följande fråga:
Vilka belägg mot nollhypotesen finns i insamlade data?
• Undvik skarp signifikansgränsEx. p = 0,04 och p =0,06 är två snarlika resultat som båda ger ”måttliga” evidensmot nollhypotesen
• P-värdet är inte sannolikheten att nollhypotesen är sann:
(Sterne & SmithBMJ 2001;322:226-231)
Sifting the evidence –what’s wrong with significance tests?
3. Tolkning av p-värden
Testets prediktiva värden bestäms av sjukdomsprevalensen
3. Tolkning av p-värden
Sannolikheten att H0 är sannFPRP = False Positive Report Probability
3. Tolkning av p-värden
P-värde omkring 0,001innebär i allmänhet starkabelägg för ett samband