Medicinsk statistik III Läkarprogrammet, Termin 5 HT 2013

Medicinsk statistik IIILäkarprogrammet, Termin 5

HT 2013

Jonas BjörkE-post: [email protected]

Medicinsk statistik III

• Mer om statistik för binära utfall–Kapitel 12

• Dimensionering av studier –Statistisk styrka (power)–En grupp, två grupper–Kontinuerliga och binära utfall–Avsnitt 6.4, 8.4 och 10.4

• Tolkning av p-värden–Statistiska vs. diagnostiska test–Avsnitt 9.2

Kapitel 12Avsnitt 6.4, 8.4, 9.2 och 10.4

Webbplats

Binära utfall• Sjuk / frisk• Positiv / negativ• Reaktion / ingen reaktion• ...

• Dikotomiseringar

1. Binära utfall

Dikotomiseringar• Kontinuerliga data

– CRP > 15– Systoliskt blodtryck >160 mmHg

• Ordinaldata (data endast möjliga att rangordna)

Ex. Klassning av allergisk reaktion

+++, ++(+), ++, +(+), +, (+), ?, -

Information kastas bort – väsentlig eller ovidkommande?

1. Binära utfall

Binära utfall - Exempel

• Alarm om glutenallergi bland barn

Bland 7 207 skolbarn i åk 6 år 2005-2006 fann man att 212 (2,9%) var glutenintoleranta

1. Hur stor är den statistiska felmarginalen

2. Kan vi vara ”säkra” på att den verkliga andelen glutenintoleranta är över 2%?

1. Binära utfall

Konfidensintervall (KI) kring en uppskattad andel

Om a 5 och (n – a) 5 kan konfidensintervallet beräknaspå följande sätt (asymptotisk = ungefärlig metod):

%4,0%9,2004,0029,00020,096.1029,0 SEcq

Prevalens q =a / n = 0,029 = 2,9%n = 7 207, a = 212 positiva

95% konfidensgrad c = 1,96, SE = Medelfel (Standard error)

0020,07207

971,0029,0)1(

n

qqSE

Felmarginal ± 0,4%95% KI: 2,5 - 3,3%

1. Binära utfall

Uppskatta en andelHur stor ska studien vara?

• Anta att vi vill skatta en andel q, t.ex. en prevalens eller risk

• Hur stor studien bör vara bestäms av– Andelen q (okänd för oss, men vi kan kanske gissa)

– Önskad felmarginal F

• Utnyttja formel för 95% KI, lös ut n:

2. Dimensioneringsberäkningar - en grupp

I boken finns motsvarande formelför ett medelvärde (formel 6.3)

Jämförelse av två andelar

• Differens q1 – q2

-Ex. prevalensdifferens, riskdifferens

• Kvot q1 / q2

-Ex. prevalenskvot, riskkvot (RR = relativ risk)

• Oddskvot OR = 1 / 2

Odds 1 = q1 / (1 – q1), 2 = q2 / (1 – q2)

Två separata (oberoende) grupper: q1 = a1 / n1, q2= a2 / n2

1. Binära utfall

Jämförelser av andelarRandomiserad studie av tamoxifen, strålbehandling och återfall av bröstcancer under fem års uppföljning

Sjukdomsfri överlevnad i grupp 1:q1 = 357 / 686 0,52 = 52%

Sjukdomsfri överlevnad i grupp 1:q2 = 276 / 689 0,40 = 40%

Vad kan vi säga om skillnaden i sjukdomsfri överlevnad (eller i återfallsrisk)?

1. Binära utfall

(Overgaard et al. 1999)

Differens mellan två andelarRandomiserad studie av tamoxifen, strålbehandling och återfall av bröstcancer bland kvinnor

Riskdifferens RD (absolut riskreduktion) = 357/ 686 – 276 / 689 0,12 = 12 fler sjukdomsfria per 100 behandlade

0267,0689

599,0401,0

686

480,0520,0)1()1(

2

22

1

11

n

qq

n

qqSE

Om a15, (n1 – a1)5, a2 5 och (n2 – a2)5 kan ett 95% KI för RD bildas som

052,012,00267,096,112,096.1 SERD 7 – 17 fler per 100

1. Binära utfall

Medelfel

Antal som behöver behandlasNNT = Numbers Needed to Treat

• NNT = 1 / RD 1 / 0,12 8,3vilket innebär att ungefär 8 (8,3) patienter behöver behandlas med kombinationsbehandlingen för att förhindra ett återfall i genomsnitt

• 95% KI för RD: 0,12 ± 0,052, dvs. 0,068 till 0,172

• 95% KI för NNT: 6 till 15 patienter behöver behandlasför att förhindra ett återfall i genomsnitt

Från föregående problem:Riskdifferens RD = 357 / 689 – 276 / 686 0,12 = 12 fler sjukdomsfria per 100 behandlade

1 / RD

1. Binära utfall

Kvot mellan två andelar

Randomiserad studie av tamoxifen, strålbehandling och återfall av bröstcancer bland kvinnor

Relativ risk RR = (413 / 689) / (329 / 686) 1,25 ln(RR) = ln(1,25) 0,223

0739,0689599,0

1

686480,0

111

2211

nqnq

SE

145,0223,00739,096,1223,096,1)ln( SERR1,08 – 1,44gånger högre risk

95% KI för RR bildas på log-skalan som

08,1145,0223,0 e 44,1145,0223,0 e

1. Binära utfall

Medelfel

gånger (25%) högre risk om enbart tamoxifen ges

Oddskvot (OR) i fall-kontrollundersökningar

95 % KI: 1,3 till 2,3 (30 till 130% riskökning)

70% riskökning bland rökare

1. Binära utfall

Odds för exponering bland fall: 630/101 6,2

Odds för exponering bland kontroller: 573/158 3,6

Statistisk styrka

• Sannolikheten a priori att H0 kommer att förkastas, givet en viss verklig skillnad mellan de grupper som studeras

• Sensitiviteten hos det statistiska testet (jämför sensitivitet hos diagnostiska test)

2. Dimensioneringsberäkningar - två grupper

Dimensioneringsberäkningar Två oberoende grupper, medelvärdesjämförelse

(Kursboken s. 156)

2. Dimensioneringsberäkningar

Dimensionering av två oberoende grupper


Gruppstorlek vs. effektstorlek3. Statistisk styrka2. Dimensioneringsberäkningar

SyreupptagningsförmågaReplikera tidigare resultat i en ny studie

30 40 50 60

5%

10%

15%

20%

25%

Percent

Låg Medel/Hög

30 40 50 60

Statisticsa

Uppskattad maximal syreupptagningsförmåga [ml/(kg*min)]36

9

38.50

33.00

38.50

43.00

Valid

Missing

N

Mean

25

50

75

Percentiles

Intensitetsnivå i konditionsträning = Låga.

Statisticsa

Uppskattad maximal syreupptagningsförmåga [ml/(kg*min)]99

30

43.82

38.00

43.00

49.00

Valid

Missing

N

Mean

25

50

75

Percentiles

Intensitetsnivå i konditionsträning = Medel/Höga.

spooled 8


Dimensioneringsberäkning (enl. 1.) Två oberoende grupper,medelvärdesjämförelse

• Ex. Syreupptagningsförmåga

2212

kks

n

625.0/,80.5 ss ,

5% signifikansgräns k1 = 1.9680% statistisk styrka k2 = 0.84

40

5

84.096.182

2

BA nn

Standardiseradeffektstorlek

pergrupp


Dimensioneringsberäkningar - Allmänt• Redovisas först och främst för primär frågeställning.

• Minst 80% statistisk styrka är ett vanligt krav om nya data ska samlas in

• Gör beräkningen under olika antaganden om , sStandardiserad effektstorlek = / s avgörande

• Ibland enklare att uppskatta variationskoefficienten

(CV=Coefficient of variation, mätt i % av medelvärdet) än standardavvikelsen

• Ta hänsyn till förväntad deltagandefrekvens

• Utnyttja tidigare studier inom området!

• I en överlevnadsanalys är det antal händelser (events) som avgör. Avvägning: Uppföljningstid - Antal patienter


Program för dimensioneringsberäkningar

• PS Power and Sample Size Calculation– Enkelt, lätt att använda– Kan laddas ned gratis via

http://biostat.mc.vanderbilt.edu/twiki/bin/view/Main/PowerSampleSize

• G*Power 3– Mer avancerat, något svårare att använda– Kan laddas ned gratis via

http://www.psycho.uni-duesseldorf.de/abteilungen/aap/gpower3

3 Statistisk styrka2. Dimensioneringsberäkningar

Diskutera med bänkgrannen...Känslighetsanalys

• Man vill kunna detektera en skillnad som är hälften så stor, dvs = 5 / 2 = 2,5 ?

• Standardavvikelsen s är 12 istället för 8 i båda grupperna?

• 90% statistisk styrka krävs (k2 = 1,28)?

Vad händer med minsta gruppstorlek i exemplet på föregående bilder om


Förklara studiens storlekRandomiserad studie av tamoxifen, strålbehandling

och återfall av bröstcancer

Författarna skrev så här i metoddelen:

3. Statistisk styrka

(Overgaard et al. 1999)


Fall-kontrollundersökningHur många fall och kontroller behövs?

• Förväntad OR =1.7 enligt tidigare studie• Rökprevalens i den befolkning vi studerar?• Utnyttja PS Power Sample Size


Statistiskt vs. Diagnostiskt test• Statistisk styrka = Sensitivitet

• Signifikansgräns (; ofta 5%) = 1 - Specificitet

4. Tolkning av p-värden

(Kursboken, s. 261)


Tolkning av p-värden

Modernt förhållningssätt

• P-värdet bör främst ses som ett index (0-1) som svarar på följande fråga:

Vilka belägg mot nollhypotesen finns i insamlade data?

• Undvik skarp signifikansgränsEx. p = 0,04 och p =0,06 är två snarlika resultat som båda ger ”måttliga” evidensmot nollhypotesen

• P-värdet är inte sannolikheten att nollhypotesen är sann:

(Sterne & SmithBMJ 2001;322:226-231)

Sifting the evidence –what’s wrong with significance tests?


Testets prediktiva värden bestäms av sjukdomsprevalensen


Sannolikheten att H0 är sannFPRP = False Positive Report Probability


P-värde omkring 0,001innebär i allmänhet starkabelägg för ett samband

Documents

Medicinsk statistik III Läkarprogrammet, Termin 5 HT 2013