Upload
nguyenlien
View
219
Download
4
Embed Size (px)
Citation preview
ST-fredagepidemiologiochbiostatistik2017
EmmaLarsson.MD,PhDSpecialistläkare,PMI,Karolinska
MaxBell.MD,PhDÖverläkare,PMI,Karolinska
Epidemiologi
≈thestudyofdiseaseoccurenceindifferentgroupsofpeopleandwhy
≈forskningdärviobserverarochkvantiGierarprevalenserochassociationer,vanligtvisutanattgenomförainterventioner
≈läranomsjukdomsförloppsdemograGi
ST-fredag 2017
Historik-JohnSnow
ST-fredag 2017
Exempel
• Frequencyofadisease/diseaseoccurrence• Mechanismbehindtheoccurrenceof…
• Preventionof…..• EstimatetheefGicacyoftreatment…• Adverseeffectsofthetreatment
ST-fredag 2017
ST-fredag2017
Attgenomföraenstudie…
• Frågeställning=hypotes…ochvadärnollhypotesen?• Studiedesign• Variabler:utfallrespektiveprediktorer• Datainsamling
• Deskriptivstatistik• Analytiskstatistik• Interferens
Studydesign
ExperimentalTheinvestigatormanipulatestheexposure–observethe
effects
RandomizedControlledTrials
Observational”Observenatureasitis”
Cohortstudies
Case-controlstudies
Cross-sectionalstudies
ST-fredag2017
Studiedesignforts
ST-fredag 2017
IncidensstudieFallrapport,fallserie
RandomiseradkliniskprövningInterventionsstudier
ObservationellkohortstudieFallkontrollstudie
Experimentella Observationella
Deskriptiva
Analytiska
Studiedesignforts
ST-fredag 2017
• Felkällor?• BiasochfelklassiGicering• ConfoundingocheffektmodiGiering
Randomizedcontrolledtrials
Patienternafördelasslumpmässigttilldeolika(beh)grupperna
àJämförbaragruppermedhänsyntillbådekändaochokändastörfaktorer
“Otherstudydesigns,includingnon-randomizedcontrolledtrials,candetectassociationsbetweenaninterventionandanoutcome.Buttheycannotruleoutthepossibilitythattheassociationwascausedbyathirdfactorlinkedtobothinterventionandoutcome” Sibbaldetal,BMJ1998;316:201
Etiskaproblem/skadligexponering
Verklighetensomstuderas?? ST-fredag2017
ST-fredag 2017
Table 1. CONSORT 2010 checklist of information to include when reporting a randomised trial (for a downloadable version of this checklist see Text S1 or the CONSORT website).*
Schulz KF, Altman DG, Moher D, for the CONSORT Group (2010) CONSORT 2010 Statement: Updated Guidelines for Reporting Parallel Group Randomised Trials. PLoS Med 7(3): e1000251. doi:10.1371/journal.pmed.1000251 http://www.plosmedicine.org/article/info:doi/10.1371/journal.pmed.1000251
ST-fredag 2017
RCT
Fördelar• Reducerareffektavconfounding
• Högstaevidensen,särskiltenmetaanalys
Nackdelar• Etiskaöverväganden• Oftaselekteradeindividerinkluderadeistudien–externvaliditet
• VissafrågorkanejbesvarasienRCT–exempel?
ST-fredag 2017
TheFragilityindexTheFragilityIndexistheminimumnumberofpatientswhosestatuswouldhavetochangefromanoneventtoaneventthatisrequiredtoturnastatisticallysigniGicantresulttoanonsigniGicantresult
ThesmallertheFragilityIndex,themorefragilethetrial’soutcome
TheFragilityIndexisausefulmetricfordemonstratinghoweasilystatisticalsigniGicancebasedonathresholdP-valuemaybeoverturned
Muchofthepublishedmedicalliterature,especiallyincriticalcare,isbuiltupon‘statisticallyfragile’trials
ST-fredag 2017
Ridgeon EE, Young PJ, Bellomo R, Mucchetti M, Lembo R, Landoni G. The Fragility Index in Multicenter Randomized Controlled Critical Care Trials. Crit Care Med. 2016 Mar 9. [Epub ahead of print] PubMed PMID: 26963326.
VarförärFragilityindexviktigt?
ST-fredag 2017
Detvisarhurskörastudier,ävenrandomiseradestudierkanvara.Exempel:Ienstudiemed100patienterdärplaceboarmenhar20dödsfallochinterventionsarmenhar9,såfrågarviossvaddetnyap-värdetskullevaraomdödsfallenändradestill20/100och10/100.Ompfortsattär<0,05uppreparviprocessentillsp>0,05.Detnumret(tillagdaevents)ärFragilityIndexochsåledesettmåttpåhurmycketvikanlitapåstudien.
Adaptivedesign-RCT
ST-fredag 2017
Chow SC, Chang M, Pong A (2005). J. Biopharm. Stat., 15 (4), 575-591. AnadaptivedesignisadesignthatallowsmodiDication(adaptation)tosomeaspects(e.g.,trialand/orstatisticalprocedures)ofon-goingtrialsafterinitiationwithoutunderminingthevalidityandintegrityofthetrials.PhRMA (2006), J. Biopharm. Stat., 16 (3), 275-283. Anadaptivedesignisreferredtoasaclinicaltrialdesignthatusesaccumulatingdatatodecideonhowtomodifyaspectsofthestudyasitcontinues,withoutunderminingthevalidityandintegrityofthetrial.
Adaptivedesign-RCTexempel
ST-fredag 2017
• Adaptiverandomizationdesign• Groupsequentialdesign• Flexiblesamplesizere-estimationdesign• Drop-the-losers(pick-the-winner)design• Adaptivedose-Gindingdesign• Biomarker-adaptivedesign• Adaptivetreatment-switchingdesign• Adaptive-hypothesesdesign• Adaptiveseamlessdesign• Two-stagephaseI/II(orII/III)adaptivedesign• Multipleadaptivedesign(anycombinationsoftheabovedesigns)
Observationalstudies
Past Present Future
Cohortstudy
Case-control
Crosssectional
ST-fredag2017
Ekologiskstudiedesign
ST-fredag 2017
Exposure Disease
?
?
CaseControl
ST-fredag2017
ST-fredag 2017
Exposure
ProspectiveCohortStudyDisease
??
Disease
??
Exposure
RetrospectiveCohortStudy
ST-fredag 2017
ST-fredag2017
Risk/tidunderrisk/persontid
• Attvara”underrisk”–atthamöjlighetenattfåvisssjukdom• Allalevandeärunderriskattdö• Endastmänärunderriskattfåprostatacancer
• Endastkvinnorärunderriskattbligravida
ST-fredag2017
Risk/tidunderrisk/persontid
• Denperiodmanärunderrisk• Entransplanteradindividärunderriskattdrabbasavavstötning
• EnpatientmedCVKärunderriskattfåenkatetersepsis
ST-fredag2017
Risk/tidunderrisk/persontid
• Tidunderriskangesoftasom”persontid”• 1personår=enpersonobserverad1år• …eller2personerobserveradeunder0,5år• ….eller365personerobserveradeunder1dag
ST-fredag2017
Risk/tidunderrisk/persontid
• Vistuderarutfallet”katetersepsis”hos10CVK-bärare• 7individerGickINTEsepsisefter9månader–tidunderriskföralladessa=niomånader
• 1patientdogefter1månad–tidunderriskenmånad
• 2patienterGicksepsisefter1respektive2månader–tidunderrisk1respektive2månader
ST-fredag2017
Risk/tidunderrisk/persontidUtfall Tid under risk Antal patienter Antal månader
Ingen sepsis 9 7 63
Död 1 1 1
Sepsis 1 1 1 1
Sepsis 2 2 1 2
• Totaltidunderrisk:63+1+1+2=67personmånader
• 67/12=5,6personår
• Eller67*30=2010persondagar
ST-fredag 2017
Prospektivtellerretrospektivt
ST-fredag 2017
Sammanfattningolikatyperstudiedesign-fördelar/nackdelar
Fall-kontrollstudieäroftalämplignärorsakertillovanligaohälsotillståndskaundersökasellernärdenpresumtivariskfaktornärdyrattmäta.
ST-fredag 2017
Rangordningdesign
1. Randomiseradkontrollerad
2. Icke-randomiseradkontrollerad3. Kohort/Fall-kontroll
ST-fredag 2017
BIOSTATISTIK
ST-fredag 2017
ST-fredag2017
Populationdensamlingvivilldraslutsatserom
Stickprov=sampleEtturvalurpopulationen
Vianvänderinformationenistickprovetförattdraslutsatserom
populationen
GruppAGruppB Utvärderaeffekt
SlutsatsStatistiskinterferens
Datanivåer(typeravvariabler)
Kvalitativavariabler=kategorivariabler
Kvantitativavariabler=numeriskavariabler
NominalavariablerUtfallenärkategoriersomintekanrangordnas
OrdinalavariablerUtfallenärordnadekategorier
BlodgrupperingKönYrke
VASBetygRökning(nej,lite,mkt)
ST-fredag2017
Datanivåer(typeravvariabler)
Kvalitativavariabler=kategorivariabler
Kvantitativavariabler=numeriskavariabler
NominalavariablerUtfallenärkategoriersomintekanrangordnas
OrdinalavariablerUtfallenärordnadekategorier
IntervallvariablerKanberäknadifferensermenintekvoter
KvotvariablerKanberäknadifferenserochkvoter
BlodgrupperingKönYrke
VASBetygRökning(nej,lite,mkt)
TemperaturmättiCochF
LängdViktÅlderRökning(antalcig/dag)
ST-fredag2017
Ytterligareindelningnumeriska(kvantitativa)variabler
Diskret=kanendastantavissavärdeninomettintervall,oftastheltal
Kontinuerlig=kaniprincipantaallavärdeninomettintervall
ST-fredag2017
Deskriptivstatistik-centralmått
• Medelvärdet
• Median(Medianvärdeanvändssomcentralmåttförsnedfördeladekontinuerliga/diskretavariablersamtförvariablersommätsmedordinalskalan.Medianvärdetärdetvärdesomliggerexaktimittenmedlikamångamätvärdenovansomundersig.
• Mode=typvärde
ST-fredag2017
n
xx
n
ii∑
== 1
Deskriptivstatistik-spridningsmått
Standardavvikelse
Hurmycketdeolikavärdenaienpopulationavvikerfrånmedelvärdet.Omdeolikavärdenaliggersamladenäramedelvärdetàstandardavvikelsenlåg.
OBS!!!!SkiljfrånSEM(standarderrorofthemean)SEMärettmåttpåosäkerheteniskattningenavmedelvärdet.SDärettmåttpåspridningenavobservationerna.(Standardavvikelsenistickprovet/rotenurstickprovsstorleken)
Range
InterQuartileRange=75:epercentilen–25:epercentilen
ST-fredag2017
1)( 2
−
−∑n
xx
minmax XX −
13 qq −
Varians
VariansochStandardavvikelse
Exempel:5observationer24,27,28,31,34
Summan:144.Medelvärde28,8.Omvitarmedelvärdetochräknarhurvarjevärdeskiljersigfrånmedelvärdet
(-4,8;-1,8;-0,8;2,2;5,2)ochsummerasdeviationernaàsumman=0
Kvadreradeviationerna,summeraà58,8
58,8/(5-1)=variansen=14,7
Standardavvikelsen=rotenurvariansen=3,8
ST-fredag2017
ST-fredag 2017
Lågtmedelvärde.Högvarians Högtmedelvärde.Lågvarians
Sammanfattningcentralmåttochspridningsmått
Normalfördeladvariabelàitypfalletredovisasmedelvärdetmed dessstandardavvikelse
Ordinaladata,kvantitativadatasomejärsymmetriska(skevtfördeladvariabel,extremvärden)àanvändmedian
tillsammansmedIQR
ST-fredag2017
Analytiskstatistik
Statistiskinterferensà demetodersomanvändsförattutifrånettstickprovdraslutsatseromenhelpopulation
ST-fredag2017
ST-fredag2017
Populationdensamlingvivilldraslutsatserom
Stickprov=sampleEtturvalurpopulationen
Vianvänderinformationenistickprovetförattdraslutsatserom
populationen
GruppAGruppB Utvärderaeffekt
SlutsatsStatistiskinterferens
Vihittarenskillnad!Bra!Eller…? Vigörenstudie
Skillnad
Verkligskillnad Slumpfel
PowerP-värde
Konaidensintervall
Systematisktfel
BiasConfounding
Ingenskillnad
Slumpfel Systematisktfel
ST-fredag2017
Punktskattningarochkonaidensintervall
Punktskattning(eng:pointestimate)informationfrånstickprovetanvändsföratt
skattaenparameteristudiepopulationen.Enpunktskattningkanvaraettenskiltvärde
ellerandel,mendetkanocksåvaraenskillnadivärdenellerandelarmellanolika
grupper.
Exempel:Viväljerslumpmässigtut100studenterpåKI(=vårtstickprov).Viregistrerarålderförde100studenternaochanvänderderasmedelålderförattgissa–skatta–medelåldernförallastudentervidKI.DettaärenpunktskattningavmedelåldernvidKI
ST-fredag2017
Förattangeosäkerhetenienpunktskattningkanmananvändaettkonaidensintervall
Ommanväljer100stickprovurenstudiepopulationochgenomförsammamätningpå
allastickprovochberäknarett95konGidensintervallförvarjestickprovkanman
förväntasigatt95avkonGidensintervallentäckerdetsannavärdeti
studiepopulationen.
à”ett95konaidensintervalltäckermed95%sannolikhetdetsannavärdetistudiepopulationen”
ST-fredag 2017
Punktskattningarochkonaidensintervall
KI=punktskattningen±konstant·standardfelet.
ExempelkonGidensintervall100studenter
Medelålder31.3
Standardavvikelsen9.7år
95%konGidensintervallfördennapunktskattning
31.3±1.96x(9.7/√100)=31.3±1.9à29.4–33.2
àMedelåldernistudiepopulationen(=allaKIstudenter)med95%sannolikhetliggermellan29.4åroch33.2år
ST-fredag 2017
1)( 2
−
−∑n
xx
Hypotesprövning
AntagattmanharberäknatettkonGidensintervallochdärmedkunnatkonstateraatt
detsannavärdetistudiepopulationenmed95%sannolikhetliggermellantvåspeciGika
gränsvärden
àvadkanmananvändadennainformationtill???
Medanalytiskstatistikkanmanaldrigbevisanågot.Däremotkanmanavfärdaen
teori–hypotes–sommindretrolig.Förattgöradettaanvändermansigavnågotsom
kallashypotesprövning.
ST-fredag2017
NollhypotesochalternativhypotesNollhypotes(eng:nullhypothesis)=detGinnsingeneffekt,ingenskillnadmellangrupperna,
Alternativhypotes=detainnsenverkligskillnad,detsom”Ginnskvar”ommanförkastarnollhypotesen(kanvaraenkelsidigellerdubbelsidig)
à Vivillkunnaförkastanollhypotesen!
ST-fredag2017
HypotesprövningmedkonaidensintervallNärmangörhypotesprövningmedkonGidensintervallberäknarman
konGidensintervalletfördenpunktskattningmanvilltesta.Enligtdeainitionenav
konaidensintervallskalldetsannavärdetistudiepopulationenmed95%
sannolikhetliggainomkonaidensintervalletsgränser.
à OmnollhypotesenliggerinomkonGidensintervalletsgränserkanalltsånollhypotesenmycketvälvaradetsannavärdet,ochnollhypotesenkanmedstorsannolikhetstämma.
à Omnollhypotesendäremotinteliggerinomintervalletsgränserkanmanförkastanollhypotesen,d.v.s.görauttalandetärnollhypotesenärmindretrolig,tillförmånföralternativhypotesen.Närmanharförkastatnollhypotesensägermanattresultatetärstatistisktsigniaikant,ellerstatistisktsäkerställt.
ST-fredag 2017
P-värdeFörutomatttestanollhypotesermedkonDidensintervallkanmanävenanvändap-värde
P-värde=sannolikheten(måsteliggamellan0och1)förattfå detobserveradeutfalletgivetattnollhypotesenärsann (dvsingenskillnad)
≈Sannolikhetenattresultatetberorpåslumpen
Omp-värdetärtillräckligtlitetansermanattdetärorimligtattnollhypotesenärsann,ochalltsåförkastarman
den.DeDinitionenav”tillräckligtliten”kanförståsvariera,mendengränsmansätteruppkallasförtestets
signiDikansnivå,ellerrisknivå.Vanliganivåerär1%(0,01),5%(0,05)och10%(0,10).Detärviktigtattmanredan
innanmanbörjatmeddestatistiskaanalysernaharbestämtsigförvilkensigniDikansnivåmanskallanvända!
ST-fredag2017
Statistisksigniaikansärejlikamedkliniskrelevans!!!
P-värdevskonaidensintervallP-värde
• Användsvidhypotesprövning
• Olikametoderberoendepåomdataärnormalfördeladeellerej
ST-fredag2017
Konaidensintervall
• Användsvidhypotesprövning
• Uttryckerosäkerhetienskattning
• Normalfördeladedata
Vihittarenskillnad!Bra!Eller…? Vigörenstudie
Skillnad
Verkligskillnad Slumpfel
PowerP-värde
Konaidensintervall
Systematisktfel
BiasConfounding
Ingenskillnad
Slumpfel Systematisktfel
ST-fredag2017
FelihypotesprövningarNaturligtviskanman,somsagtstidigare,aldrigbevisanågotmedanalytiskstatistik,utanmanlöperhelatidenriskattgörafel
avnågotslag–antingenförkastarmanennollhypotessomintebordehaförkastats,ellersåförkastarmaninteen
nollhypotessombordehaförkastats.Dessatvåfelenbetecknasαochβ.
à TypIfel:manhittareneffektsomegentligeninteBinns.
à TypIIfel(β):manintehittareneffektsomfaktisktBinns(samplesize)
Statistiskstyrka(eng:power)betecknarsannolikhetenatthittaeneffektsomBinns,och
beräknasgenom1-β.
ST-fredag2017
VERKLIGHETBehandlinghareffekt
Behandlingharingeneffekt
STUDIENVISAR
Behandlinghareffekt
Bra! α
Behandlingharingeneffekt
β Bra!
”Power–beräkning”(styrkeberäkning)
Uppskattningavhurstorstudienmåstevaraförattupptäckaett
förväntatresultat(exskillnadisjukdomsriskhosexponerade
individerochoexponeradeindivider
ST-fredag 2017
Vihittarenskillnad!Bra!Eller…? Vigörenstudie
Skillnad
Verkligskillnad Slumpfel
PowerP-värde
Konaidensintervall
Systematisktfel
BiasConfounding
Ingenskillnad
Slumpfel Systematisktfel
ST-fredag2017
BiasochconfoundingSystematiskafel(eng:bias)uppstårnärmätresultatenharentendensatt
avvikafråndetsannavärdetpåettsystematisktsätt(dvsallamätvärden
avvikerfråndetsannavärdetpåsammasätt).
• Selectionbias–felvididentiGieringavstudiepopulationen• Exmanundersökerenbartdesomfrivilligtanmälersigtill
undersökning.• Observationorinformationbias–felvidmätningavexponeringellerutfall• Exs.k.recallbiasifalkontrollstudier,”lättare”attkontrollererinrarsig
attdevaritutsattaförmisstänkaexponeringsfaktorer
ST-fredag2017
Confounding(störfaktor):exponeradeochoexponeradekan
skiljasigmedavseendepåförekomstenavnågonannanfaktor
somisigpåverkarriskenattinsjukna.
ST-fredag 2017
Biasochconfounding
Confounder
Exposure Outcome
1-associeradmedexponeringen2-självständigriskfaktorförsjukdomen3-inteettmellanstegikausalkedjanfrånexponeringtilleffekt(ejEàCàO)
Felkällor
ST-fredag2017
Fullständigprecision–frånvaroavslumpmässigafel.Åtgärdàexempelvisökaantaletindivider,bättremätinstrument
Fullständigvaliditet–frånvaroavsystematiskafel
NormalfördelningEnteoretiskfördelning(≈deGinieradavenmatematiskformel).
Mångafenomeninaturenföljernormalfördelningen,exempelvis
födelsevikter.
Gårfrånminustillplusoändligheten.
Symmetrisk.Ytanunderkurvannär1
DeGinierasutifråntvåfaktorer:
• medelvärdet
• standardavvikelsen(=rotenurvariansen)
ST-fredag2017
Normalfördelningforts.
ST-fredag2017
Inomintervalletsomgårfrån1,96standardavvikelserundermedelvärdettill1,96standardavvikelserövermedelvärdetligger95%avobservationerna
Exempelstatistiskatester/modellerParametriskatester/modeller(byggerpåantagandenomhurdata
fördelarsig(oftastnormalfördelningen),skattareneffekt(exskillnadimedelvärde)förvilkenmankanberäknakonDidensintervallochp-värde)
• Twosamplet-test• Pairedt-test• Regressionsanalys• Variansanalys(ANOVA)
Icke-parametriska:(kananvoberoendeavhurdatafördelarsig,baseraspåobservationernasranger,beräknarendastp-värde)
• Mann-Whitneytwosampletest• Chi-2test• Fischersexaktatest• Wilcoxonsmatchedpairstest• Spearman’srankcorrelationcoefGicient
ST-fredag2017
Korrelationskoefaicient
Korrelationärettbegreppinomstatistikensomangerstyrkan
ellerriktningenavettsambandmellan2variabler.Detkallasäven
korrelationskoefGicient.Uttryckssomettsambandmellan1och-1
där0angeringetsamband,
1angermaximaltpossamband
och-1maximaltnegsamband
ST-fredag 2017
Regressionsanalys• Studerasambandetmellanolikavariabler
• Centralainomepidemiologiskforskning,multipelregressionsanalyskananvändasförattkontrolleraförförväxlingcondfounder)ochförattskapaprediktionsmodeller
• DataanvförattbestämmaenekvationellermatematiskmodellsombeskriverhurenutfallsvariabelvarierarsomenfunktionavenellerGleraförklarandevariabler.UtfrånmodellenkansedansambandetmellanvariablernakvantiGieras.
ST-fredag 2017
ST-fredag2017
Sjukdomsförekomst
Incidence–”Hurmångablirsjuka?” àmåttpåhurmångasominsjuknarunderengiventidsperiod
Kumulativincidence(=risk):andelenavenpopulationsominsjuknarunderengiventidsperiod.Antaletinsjuknade/antalfriskavidstart.
Exårligeninsjuknar5%avSverigesbefolkningiinDluensa
Incidencerate:antalnyasjukdomsfallunderengiventidsperiod/totalrisktid.
ExincidensenavMbChronär5per100.000personår.
Prevalens–”Hurmångaärsjuka?” ”Diseasestatus””Diseaseburdeninapopulation”
àproportionenavpopulationensomharensjukdom(elleregenskap)videttgivettillfälle
ST-fredag2017
AssociationsmåttJämförelsemellanexponeradeochickeexponeradegrupper(exponering=t.ex.enspeciGikbehandling)
Absolutaochrelativamått• Riskdifferens• Relativrisk:indikerarsannolikhetenattutvecklasjukdom(outcome)iexponeradgruppjämförtmedoexponeradgrupp
• OddsRatio• HazardRatio
ST-fredag2017
Sensitivitet/speciaicitetSensitivitet=sannolikhetenattensjukindividblirklassiGiceradsomsjuk
Speciaicitet=sannolikhetenattenfriskindividblirklassiGiceradsomfrisk
PositivtochnegativtprediktivtvärdeSannolikhetenförsjukdom,givetetttestresultat,kallasförtestetsprediktivavärde.
Positivtprediktivtvärde=sannolikhetenattenindividmedett"sjukt"provsvar verkligenärsjuk
Negativtprediktivtvärde=sannolikhetenattenindividmedett"friskt"provsvar verkligenärfrisk
ST-fredag2017
ST-fredag2017
Sjuk Frisk
Sjuk A B
Frisk C D
SensitivitetA/(A+C)
SpeciaicitetD/(B+D)
PospredvärdeA/(A+B)
NegpredvärdeD/(C+D)
Verklighet
Test
ST-fredag2017
läkartidningen nr 9–10 2013 volym 110470
Biostatistik är en integrerad och central del av epidemiologin, och biostatistiska metoder används vid såväl planering som analys av epidemiologiska studier.
Innan en studie genomförs används s!k styrkeberäkningar (power-beräkningar) för att uppskatta hur stor studien måste vara för att kunna upptäcka ett förväntat resultat, t!ex en viss skillnad i sjukdomsrisk hos individer med (exponerade) och utan (oexponerade) en viss egenskap eller levnadsvana. När studiematerialet väl är insamlat används andra metoder för att beskriva materialet och beräkna relativa risker och and ra riskmått samt för att uppskatta inverkan av slumpmässiga fel i studien. Ytterligare metoder finns för att undersöka om ett samband mellan en exponering och ett utfall i själva verket förklaras av en tredje faktor – en s!k förväxlingsfaktor (con-founder) (Fakta 1). Därutöver finns fler mer avancerade bio-statistiska metoder.
Artikeln ger en introduktion till grundläggande biostatis-tiska metoder och begrepp som flitigt används i epidemiolo-
giska studier. Texten fokuserar på observationella kliniska studier, men flera av koncepten är relevanta även för rando-miserade kliniska studier.
Deskriptiv statistikDeskriptiv statistik används för att sammanställa studiema-terial med hjälp av tabeller, figurer och olika former av sam-manfattande mått, såsom medelvärden och procenttal. En koncis och informativ sammanställning kan ge god överblick över ett stort studiematerial, peka på trender i materialet och ge ledtrådar om hur man bör gå vidare med mer avancerade analyser.
Vilka former av sammanfattande mått som används i den deskriptiva sammanställningen beror på vilka typer av va-riabler som ingår i materialet. Det finns två huvudgrupper av variabler: kategoriska variabler (som etnicitet eller kön) och numeriska variabler (som ålder eller kroppsvikt). Kategoriska variabler beskrivs oftast med andelen eller antalet individer i respektive kategori. För numeriska variabler beräknas i stäl-let ofta ett centralmått och ett spridningsmått; centralmåttet beskriver variabelns »tyngdpunkt«, medan spridningsmåttet
Q klinik & vetenskap verktyg för klinisk forskning (9/14)
Biostatistik har en central roll i epidemiologiIntroduktion till begrepp och metoder utifrån kliniska observationella studier
��QsammanfattatBiostatistik är en central del av epidemiologisk forskning. Deskriptiv statistik används för att sammanställa studiemate-rial med hjälp av tabeller, figu-rer och olika sammanfattande mått, såsom medelvärden och procenttal.Regressionsanalys används ofta för att beräkna absoluta och relativa risker; riskmåtten speglar styrkan av sambandet mellan en exponering och före-komsten av ett visst utfall.
Inverkan av slumpmässiga fel i en studie kan kvantifieras med hjälp av P-värden och konfi-dens intervall. Vid statistisk slutledning tolkas huvudresultatet (riskmåttet) i ljuset av inverkan av slumpmäs-siga fel i studien. Statistik slutledning är bara en del av tolkningen av ett studie-resultat.
ANDREAS PETTERSSON, med dr, leg läkare, enheten för klinisk epidemiologi, Karolinska insti-tutet, Stockholm; Department of Epidemiology, Harvard School of Public Health, Bos-ton, MA, USA [email protected] GORDON, doktorand, spe-cialistläkare i ortopedi, institu-tionen för kliniska vetenskaper, Danderyds sjukhus, Karolinska institutet, Stockholm
GUSTAF EDGREN, docent, AT-lä-kare, Department of Epidemiol-ogy, Harvard School of Public Health, Boston, MA, USA PAUL W DICKMAN, PhD, univer-sitetslektor i biostatistik; de båda sistnämnda institutionen för medicinsk epidemiologi och biostatistik, Karolinska institu-tet, Stockholm
��Qfakta 1. FörväxlingFörväxling (confounding) innebär att sambandet mel-lan en exponering och ett utfall i själva verket helt el-ler delvis förklaras av att exponeringen samvarierar med en annan exponering (förväxlingsfaktor) som di-rekt eller indirekt orsakar utfallet man är intresserad av. Till exempel skulle ett sam-band mellan rökning (expo-nering) och koloncancer (ut-fall) helt eller delvis kunna förklaras av (vara »förväx-lat« med) att rökare äter mer rött kött än icke-rökare och att intag av rött kött (förväx-lingsfaktor) i sin tur orsakar koloncancer. En förväxlingsfaktor har tre
egenskaper, den• samvarierar med expone-
ringen• orsakar utfallet direkt el-
ler indirekt• är inte en del av orsaks-
kedjan mellan expone-ringen och utfallet.
En fördel med randomisera-de kliniska studier jämfört med observationella klinis-ka studier är att randomise-ringen i sig minimerar risken för förväxling, eftersom del-tagarna slumpmässigt ran-domiseras till att exponeras eller inte. Exponeringen samvarierar därmed inte med någon förväxlingsfak-tor, utan är slumpmässigt fördelad.
»Verktyg för klinisk forskning« är en artikelserie som omfattar 14 artiklar om grundläggande principer för hur man planerar och ge-nomför kliniska forskningsstudier. Serien startade i nr 3/2013.
Illus
trat
ion:
Jako
b Ro
bert
sson
/Typ
ofor
m
ST-fredag2017
ST-fredag 2017
Omtidsnöd–vadskajagfokuserapåinförtentan?• Datanivåer• Central-ochspridningsmått
• P-värde/konGidensintervall• Bias/confounding
• Normalfördelning
ST-fredag2017
In designing a study:
a)Power analysis should be carried out before starting a study to find out the number of cases to be included in the study.
Correct Answer: Trueb)Power of the study should be at least 95%.
Correct Answer: FalsePower analysis is performed to determine the sample size required to show a certain difference. Power= 1-beta, where beta=type II error. The power of the study should be at least 80%. This means there should be at least an 80% chance of detecting a difference, if a difference exists.c)Cross over design is the most common method of controlling.
Correct Answer: FalseThe two groups method is the most common method of controlling. One group receives the study drug (for example) and the other acts as a control.d)The level of significance (p value) chosen is always 0.05%.
Correct Answer: FalseA probability of less than 0.05 represents statistical significance. However, more stringent levels of probability are sometimes used for example P<0.01e)Blinding and Randomisation helps in reducing Bias.
Correct Answer: TruePatients are randomly allocated to one or the other group in order to reduce the chances of bias towards one or the other treatment.
ST-fredag 2017
Regarding Statistical Distribution of data:
a)In skewed data, non parametric tests are more appropriate.
Correct Answer: Trueb)In normal distribution, Mean, Median and Mode have same value.
Correct Answer: Truec)In Gaussean distribution, one Standard Deviation below and above mean includes 63% of data.
Correct Answer: FalseFor data which is normally distributed, 68% of them will fall between 1SD on either side of the mean, 95% within 1.96SD and 99% within 3SD.d)Nominal and Ordinal data which are normally distributed are Parametric data.
Correct Answer: FalseInterval or ratio data, which are normally distributed are called parametric data. All other data (Nominal, Ordinal) are called non-parametric.e)Student t test can be used for normally distributed interval data.
Correct Answer: True
ST-fredag 2017
Tvåvariabler
�Iblandvillmanundersökaomtvåvariabler
”hängerihop”
�Exempelmaterial:
�195manligayrkesGiskaremellan31och59år
�BlodanalyseratförPCBochHg
�HarenGiskaremedhögtPCBocksåhögtHg?
�Barasamvariation→korrelation
�Enpåverkardenandra→linjärregression
Korrelationskoefficienter används för att visa hur två
variabler samvarierar
� För normalfördelade data används Pearsons
korrelationskoefficient (r)
� För övriga data används Spearmans
korrelationskoefficient (rS)
ST-fredag 2017
� Om en variabel påverkar den andra använder
man linjär regression
� Exempel: Om y alltid är samma som x kan
man skriva y = x
� Exempel: Om y alltid är dubbelt så stor som x
kan man skriva y = 2x
� y kallas för den beroende variabeln
� x kallas för den oberoende variabeln
En generell formel för sambandet mellan y
och x kan skrivas y = βx
� β kallas för ekvationens riktningskoefficient
eller lutningskoefficient (slope)
� Tolkningen av β är
� För varje enhet x ökar, ökar y β enheter
� En individ med en enhet högre x har β enheter
högre y
� β kan vara negativ = minskning
ST-fredag 2017
Förvarjevärdepåxmåsteyvaranormalfördelad�Samtligaobservationermåstevaraoberoende�Förhållandetmellanxochymåstevaralinjärt
The Normal Distribution The Central Limit Theorem The p-value Standard Error of the Mean Type I and II Errors Power of a Statistical Test One versus Two-tailed Tests
Bayesiansk statistik
ST-fredag 2017
ST-fredag 2017
Deegenskapersombeskrivsovanharanväntsförattkonstruerastatistiskatest.Eftersomdessatestbyggerpåbl.a.
normalfördelningensparametrarkallasdeförparametriskatest(eng:parametricaltests).Förattparametriska
testskallkunnaanvändasmåstedetdatamaterialmananalyserarhasammaegenskaperdenfördelningpåvilkentestenärbaserade,d.v.s.datamåstevaranormalfördelade.(DetGinns
ävenandrateoretiskafördelningarpåvilkastatistiskatestärbaserade,mendettaingårinteikursen.)