78
ST-fredag epidemiologi och biostatistik 2017 Emma Larsson. MD, PhD Specialistläkare, PMI, Karolinska Max Bell. MD, PhD Överläkare, PMI, Karolinska

ST-fredag epidemiologi och biostatistik 2017 · PDF fileEpidemiologi ≈ the study of disease occurence in different groups of people and why ≈ forskning där vi observerar och kvantiierar

Embed Size (px)

Citation preview

Page 1: ST-fredag epidemiologi och biostatistik 2017 · PDF fileEpidemiologi ≈ the study of disease occurence in different groups of people and why ≈ forskning där vi observerar och kvantiierar

ST-fredagepidemiologiochbiostatistik2017

EmmaLarsson.MD,PhDSpecialistläkare,PMI,Karolinska

MaxBell.MD,PhDÖverläkare,PMI,Karolinska

Page 2: ST-fredag epidemiologi och biostatistik 2017 · PDF fileEpidemiologi ≈ the study of disease occurence in different groups of people and why ≈ forskning där vi observerar och kvantiierar

Epidemiologi

≈thestudyofdiseaseoccurenceindifferentgroupsofpeopleandwhy

≈forskningdärviobserverarochkvantiGierarprevalenserochassociationer,vanligtvisutanattgenomförainterventioner

≈läranomsjukdomsförloppsdemograGi

ST-fredag 2017

Page 3: ST-fredag epidemiologi och biostatistik 2017 · PDF fileEpidemiologi ≈ the study of disease occurence in different groups of people and why ≈ forskning där vi observerar och kvantiierar

Historik-JohnSnow

ST-fredag 2017

Page 4: ST-fredag epidemiologi och biostatistik 2017 · PDF fileEpidemiologi ≈ the study of disease occurence in different groups of people and why ≈ forskning där vi observerar och kvantiierar

Exempel

•  Frequencyofadisease/diseaseoccurrence•  Mechanismbehindtheoccurrenceof…

•  Preventionof…..•  EstimatetheefGicacyoftreatment…•  Adverseeffectsofthetreatment

ST-fredag 2017

Page 5: ST-fredag epidemiologi och biostatistik 2017 · PDF fileEpidemiologi ≈ the study of disease occurence in different groups of people and why ≈ forskning där vi observerar och kvantiierar

ST-fredag2017

Attgenomföraenstudie…

•  Frågeställning=hypotes…ochvadärnollhypotesen?•  Studiedesign•  Variabler:utfallrespektiveprediktorer•  Datainsamling

•  Deskriptivstatistik•  Analytiskstatistik•  Interferens

Page 6: ST-fredag epidemiologi och biostatistik 2017 · PDF fileEpidemiologi ≈ the study of disease occurence in different groups of people and why ≈ forskning där vi observerar och kvantiierar

Studydesign

ExperimentalTheinvestigatormanipulatestheexposure–observethe

effects

RandomizedControlledTrials

Observational”Observenatureasitis”

Cohortstudies

Case-controlstudies

Cross-sectionalstudies

ST-fredag2017

Page 7: ST-fredag epidemiologi och biostatistik 2017 · PDF fileEpidemiologi ≈ the study of disease occurence in different groups of people and why ≈ forskning där vi observerar och kvantiierar

Studiedesignforts

ST-fredag 2017

IncidensstudieFallrapport,fallserie

RandomiseradkliniskprövningInterventionsstudier

ObservationellkohortstudieFallkontrollstudie

Experimentella Observationella

Deskriptiva

Analytiska

Page 8: ST-fredag epidemiologi och biostatistik 2017 · PDF fileEpidemiologi ≈ the study of disease occurence in different groups of people and why ≈ forskning där vi observerar och kvantiierar

Studiedesignforts

ST-fredag 2017

•  Felkällor?•  BiasochfelklassiGicering•  ConfoundingocheffektmodiGiering

Page 9: ST-fredag epidemiologi och biostatistik 2017 · PDF fileEpidemiologi ≈ the study of disease occurence in different groups of people and why ≈ forskning där vi observerar och kvantiierar

Randomizedcontrolledtrials

Patienternafördelasslumpmässigttilldeolika(beh)grupperna

àJämförbaragruppermedhänsyntillbådekändaochokändastörfaktorer

“Otherstudydesigns,includingnon-randomizedcontrolledtrials,candetectassociationsbetweenaninterventionandanoutcome.Buttheycannotruleoutthepossibilitythattheassociationwascausedbyathirdfactorlinkedtobothinterventionandoutcome” Sibbaldetal,BMJ1998;316:201

Etiskaproblem/skadligexponering

Verklighetensomstuderas?? ST-fredag2017

Page 10: ST-fredag epidemiologi och biostatistik 2017 · PDF fileEpidemiologi ≈ the study of disease occurence in different groups of people and why ≈ forskning där vi observerar och kvantiierar

ST-fredag 2017

Page 11: ST-fredag epidemiologi och biostatistik 2017 · PDF fileEpidemiologi ≈ the study of disease occurence in different groups of people and why ≈ forskning där vi observerar och kvantiierar

Table 1. CONSORT 2010 checklist of information to include when reporting a randomised trial (for a downloadable version of this checklist see Text S1 or the CONSORT website).*

Schulz KF, Altman DG, Moher D, for the CONSORT Group (2010) CONSORT 2010 Statement: Updated Guidelines for Reporting Parallel Group Randomised Trials. PLoS Med 7(3): e1000251. doi:10.1371/journal.pmed.1000251 http://www.plosmedicine.org/article/info:doi/10.1371/journal.pmed.1000251

ST-fredag 2017

Page 12: ST-fredag epidemiologi och biostatistik 2017 · PDF fileEpidemiologi ≈ the study of disease occurence in different groups of people and why ≈ forskning där vi observerar och kvantiierar

RCT

Fördelar•  Reducerareffektavconfounding

•  Högstaevidensen,särskiltenmetaanalys

Nackdelar•  Etiskaöverväganden•  Oftaselekteradeindividerinkluderadeistudien–externvaliditet

•  VissafrågorkanejbesvarasienRCT–exempel?

ST-fredag 2017

Page 13: ST-fredag epidemiologi och biostatistik 2017 · PDF fileEpidemiologi ≈ the study of disease occurence in different groups of people and why ≈ forskning där vi observerar och kvantiierar

TheFragilityindexTheFragilityIndexistheminimumnumberofpatientswhosestatuswouldhavetochangefromanoneventtoaneventthatisrequiredtoturnastatisticallysigniGicantresulttoanonsigniGicantresult

ThesmallertheFragilityIndex,themorefragilethetrial’soutcome

TheFragilityIndexisausefulmetricfordemonstratinghoweasilystatisticalsigniGicancebasedonathresholdP-valuemaybeoverturned

Muchofthepublishedmedicalliterature,especiallyincriticalcare,isbuiltupon‘statisticallyfragile’trials

ST-fredag 2017

Ridgeon EE, Young PJ, Bellomo R, Mucchetti M, Lembo R, Landoni G. The Fragility Index in Multicenter Randomized Controlled Critical Care Trials. Crit Care Med. 2016 Mar 9. [Epub ahead of print] PubMed PMID: 26963326.

Page 14: ST-fredag epidemiologi och biostatistik 2017 · PDF fileEpidemiologi ≈ the study of disease occurence in different groups of people and why ≈ forskning där vi observerar och kvantiierar

VarförärFragilityindexviktigt?

ST-fredag 2017

Detvisarhurskörastudier,ävenrandomiseradestudierkanvara.Exempel:Ienstudiemed100patienterdärplaceboarmenhar20dödsfallochinterventionsarmenhar9,såfrågarviossvaddetnyap-värdetskullevaraomdödsfallenändradestill20/100och10/100.Ompfortsattär<0,05uppreparviprocessentillsp>0,05.Detnumret(tillagdaevents)ärFragilityIndexochsåledesettmåttpåhurmycketvikanlitapåstudien.

Page 15: ST-fredag epidemiologi och biostatistik 2017 · PDF fileEpidemiologi ≈ the study of disease occurence in different groups of people and why ≈ forskning där vi observerar och kvantiierar

Adaptivedesign-RCT

ST-fredag 2017

Chow SC, Chang M, Pong A (2005). J. Biopharm. Stat., 15 (4), 575-591. AnadaptivedesignisadesignthatallowsmodiDication(adaptation)tosomeaspects(e.g.,trialand/orstatisticalprocedures)ofon-goingtrialsafterinitiationwithoutunderminingthevalidityandintegrityofthetrials.PhRMA (2006), J. Biopharm. Stat., 16 (3), 275-283. Anadaptivedesignisreferredtoasaclinicaltrialdesignthatusesaccumulatingdatatodecideonhowtomodifyaspectsofthestudyasitcontinues,withoutunderminingthevalidityandintegrityofthetrial.

Page 16: ST-fredag epidemiologi och biostatistik 2017 · PDF fileEpidemiologi ≈ the study of disease occurence in different groups of people and why ≈ forskning där vi observerar och kvantiierar

Adaptivedesign-RCTexempel

ST-fredag 2017

• Adaptiverandomizationdesign• Groupsequentialdesign• Flexiblesamplesizere-estimationdesign• Drop-the-losers(pick-the-winner)design• Adaptivedose-Gindingdesign• Biomarker-adaptivedesign• Adaptivetreatment-switchingdesign• Adaptive-hypothesesdesign• Adaptiveseamlessdesign• Two-stagephaseI/II(orII/III)adaptivedesign• Multipleadaptivedesign(anycombinationsoftheabovedesigns)

Page 17: ST-fredag epidemiologi och biostatistik 2017 · PDF fileEpidemiologi ≈ the study of disease occurence in different groups of people and why ≈ forskning där vi observerar och kvantiierar

Observationalstudies

Past Present Future

Cohortstudy

Case-control

Crosssectional

ST-fredag2017

Page 18: ST-fredag epidemiologi och biostatistik 2017 · PDF fileEpidemiologi ≈ the study of disease occurence in different groups of people and why ≈ forskning där vi observerar och kvantiierar

Ekologiskstudiedesign

ST-fredag 2017

Page 19: ST-fredag epidemiologi och biostatistik 2017 · PDF fileEpidemiologi ≈ the study of disease occurence in different groups of people and why ≈ forskning där vi observerar och kvantiierar

Exposure Disease

?

?

CaseControl

ST-fredag2017

Page 20: ST-fredag epidemiologi och biostatistik 2017 · PDF fileEpidemiologi ≈ the study of disease occurence in different groups of people and why ≈ forskning där vi observerar och kvantiierar

ST-fredag 2017

Exposure

ProspectiveCohortStudyDisease

??

Disease

??

Exposure

RetrospectiveCohortStudy

Page 21: ST-fredag epidemiologi och biostatistik 2017 · PDF fileEpidemiologi ≈ the study of disease occurence in different groups of people and why ≈ forskning där vi observerar och kvantiierar

ST-fredag 2017

Page 22: ST-fredag epidemiologi och biostatistik 2017 · PDF fileEpidemiologi ≈ the study of disease occurence in different groups of people and why ≈ forskning där vi observerar och kvantiierar

ST-fredag2017

Risk/tidunderrisk/persontid

•  Attvara”underrisk”–atthamöjlighetenattfåvisssjukdom•  Allalevandeärunderriskattdö•  Endastmänärunderriskattfåprostatacancer

•  Endastkvinnorärunderriskattbligravida

Page 23: ST-fredag epidemiologi och biostatistik 2017 · PDF fileEpidemiologi ≈ the study of disease occurence in different groups of people and why ≈ forskning där vi observerar och kvantiierar

ST-fredag2017

Risk/tidunderrisk/persontid

•  Denperiodmanärunderrisk•  Entransplanteradindividärunderriskattdrabbasavavstötning

•  EnpatientmedCVKärunderriskattfåenkatetersepsis

Page 24: ST-fredag epidemiologi och biostatistik 2017 · PDF fileEpidemiologi ≈ the study of disease occurence in different groups of people and why ≈ forskning där vi observerar och kvantiierar

ST-fredag2017

Risk/tidunderrisk/persontid

•  Tidunderriskangesoftasom”persontid”•  1personår=enpersonobserverad1år•  …eller2personerobserveradeunder0,5år•  ….eller365personerobserveradeunder1dag

Page 25: ST-fredag epidemiologi och biostatistik 2017 · PDF fileEpidemiologi ≈ the study of disease occurence in different groups of people and why ≈ forskning där vi observerar och kvantiierar

ST-fredag2017

Risk/tidunderrisk/persontid

•  Vistuderarutfallet”katetersepsis”hos10CVK-bärare•  7individerGickINTEsepsisefter9månader–tidunderriskföralladessa=niomånader

•  1patientdogefter1månad–tidunderriskenmånad

•  2patienterGicksepsisefter1respektive2månader–tidunderrisk1respektive2månader

Page 26: ST-fredag epidemiologi och biostatistik 2017 · PDF fileEpidemiologi ≈ the study of disease occurence in different groups of people and why ≈ forskning där vi observerar och kvantiierar

ST-fredag2017

Risk/tidunderrisk/persontidUtfall Tid under risk Antal patienter Antal månader

Ingen sepsis 9 7 63

Död 1 1 1

Sepsis 1 1 1 1

Sepsis 2 2 1 2

• Totaltidunderrisk:63+1+1+2=67personmånader

• 67/12=5,6personår

• Eller67*30=2010persondagar

Page 27: ST-fredag epidemiologi och biostatistik 2017 · PDF fileEpidemiologi ≈ the study of disease occurence in different groups of people and why ≈ forskning där vi observerar och kvantiierar

ST-fredag 2017

Page 28: ST-fredag epidemiologi och biostatistik 2017 · PDF fileEpidemiologi ≈ the study of disease occurence in different groups of people and why ≈ forskning där vi observerar och kvantiierar

Prospektivtellerretrospektivt

ST-fredag 2017

Page 29: ST-fredag epidemiologi och biostatistik 2017 · PDF fileEpidemiologi ≈ the study of disease occurence in different groups of people and why ≈ forskning där vi observerar och kvantiierar

Sammanfattningolikatyperstudiedesign-fördelar/nackdelar

Fall-kontrollstudieäroftalämplignärorsakertillovanligaohälsotillståndskaundersökasellernärdenpresumtivariskfaktornärdyrattmäta.

ST-fredag 2017

Page 30: ST-fredag epidemiologi och biostatistik 2017 · PDF fileEpidemiologi ≈ the study of disease occurence in different groups of people and why ≈ forskning där vi observerar och kvantiierar

Rangordningdesign

1. Randomiseradkontrollerad

2. Icke-randomiseradkontrollerad3. Kohort/Fall-kontroll

ST-fredag 2017

Page 31: ST-fredag epidemiologi och biostatistik 2017 · PDF fileEpidemiologi ≈ the study of disease occurence in different groups of people and why ≈ forskning där vi observerar och kvantiierar

BIOSTATISTIK

ST-fredag 2017

Page 32: ST-fredag epidemiologi och biostatistik 2017 · PDF fileEpidemiologi ≈ the study of disease occurence in different groups of people and why ≈ forskning där vi observerar och kvantiierar

ST-fredag2017

Populationdensamlingvivilldraslutsatserom

Stickprov=sampleEtturvalurpopulationen

Vianvänderinformationenistickprovetförattdraslutsatserom

populationen

GruppAGruppB Utvärderaeffekt

SlutsatsStatistiskinterferens

Page 33: ST-fredag epidemiologi och biostatistik 2017 · PDF fileEpidemiologi ≈ the study of disease occurence in different groups of people and why ≈ forskning där vi observerar och kvantiierar

Datanivåer(typeravvariabler)

Kvalitativavariabler=kategorivariabler

Kvantitativavariabler=numeriskavariabler

NominalavariablerUtfallenärkategoriersomintekanrangordnas

OrdinalavariablerUtfallenärordnadekategorier

BlodgrupperingKönYrke

VASBetygRökning(nej,lite,mkt)

ST-fredag2017

Page 34: ST-fredag epidemiologi och biostatistik 2017 · PDF fileEpidemiologi ≈ the study of disease occurence in different groups of people and why ≈ forskning där vi observerar och kvantiierar

Datanivåer(typeravvariabler)

Kvalitativavariabler=kategorivariabler

Kvantitativavariabler=numeriskavariabler

NominalavariablerUtfallenärkategoriersomintekanrangordnas

OrdinalavariablerUtfallenärordnadekategorier

IntervallvariablerKanberäknadifferensermenintekvoter

KvotvariablerKanberäknadifferenserochkvoter

BlodgrupperingKönYrke

VASBetygRökning(nej,lite,mkt)

TemperaturmättiCochF

LängdViktÅlderRökning(antalcig/dag)

ST-fredag2017

Page 35: ST-fredag epidemiologi och biostatistik 2017 · PDF fileEpidemiologi ≈ the study of disease occurence in different groups of people and why ≈ forskning där vi observerar och kvantiierar

Ytterligareindelningnumeriska(kvantitativa)variabler

Diskret=kanendastantavissavärdeninomettintervall,oftastheltal

Kontinuerlig=kaniprincipantaallavärdeninomettintervall

ST-fredag2017

Page 36: ST-fredag epidemiologi och biostatistik 2017 · PDF fileEpidemiologi ≈ the study of disease occurence in different groups of people and why ≈ forskning där vi observerar och kvantiierar

Deskriptivstatistik-centralmått

• Medelvärdet

• Median(Medianvärdeanvändssomcentralmåttförsnedfördeladekontinuerliga/diskretavariablersamtförvariablersommätsmedordinalskalan.Medianvärdetärdetvärdesomliggerexaktimittenmedlikamångamätvärdenovansomundersig.

• Mode=typvärde

ST-fredag2017

n

xx

n

ii∑

== 1

Page 37: ST-fredag epidemiologi och biostatistik 2017 · PDF fileEpidemiologi ≈ the study of disease occurence in different groups of people and why ≈ forskning där vi observerar och kvantiierar

Deskriptivstatistik-spridningsmått

Standardavvikelse

Hurmycketdeolikavärdenaienpopulationavvikerfrånmedelvärdet.Omdeolikavärdenaliggersamladenäramedelvärdetàstandardavvikelsenlåg.

OBS!!!!SkiljfrånSEM(standarderrorofthemean)SEMärettmåttpåosäkerheteniskattningenavmedelvärdet.SDärettmåttpåspridningenavobservationerna.(Standardavvikelsenistickprovet/rotenurstickprovsstorleken)

Range

InterQuartileRange=75:epercentilen–25:epercentilen

ST-fredag2017

1)( 2

−∑n

xx

minmax XX −

13 qq −

Varians

Page 38: ST-fredag epidemiologi och biostatistik 2017 · PDF fileEpidemiologi ≈ the study of disease occurence in different groups of people and why ≈ forskning där vi observerar och kvantiierar

VariansochStandardavvikelse

Exempel:5observationer24,27,28,31,34

Summan:144.Medelvärde28,8.Omvitarmedelvärdetochräknarhurvarjevärdeskiljersigfrånmedelvärdet

(-4,8;-1,8;-0,8;2,2;5,2)ochsummerasdeviationernaàsumman=0

Kvadreradeviationerna,summeraà58,8

58,8/(5-1)=variansen=14,7

Standardavvikelsen=rotenurvariansen=3,8

ST-fredag2017

Page 39: ST-fredag epidemiologi och biostatistik 2017 · PDF fileEpidemiologi ≈ the study of disease occurence in different groups of people and why ≈ forskning där vi observerar och kvantiierar

ST-fredag 2017

Lågtmedelvärde.Högvarians Högtmedelvärde.Lågvarians

Page 40: ST-fredag epidemiologi och biostatistik 2017 · PDF fileEpidemiologi ≈ the study of disease occurence in different groups of people and why ≈ forskning där vi observerar och kvantiierar

Sammanfattningcentralmåttochspridningsmått

Normalfördeladvariabelàitypfalletredovisasmedelvärdetmed dessstandardavvikelse

Ordinaladata,kvantitativadatasomejärsymmetriska(skevtfördeladvariabel,extremvärden)àanvändmedian

tillsammansmedIQR

ST-fredag2017

Page 41: ST-fredag epidemiologi och biostatistik 2017 · PDF fileEpidemiologi ≈ the study of disease occurence in different groups of people and why ≈ forskning där vi observerar och kvantiierar

Analytiskstatistik

Statistiskinterferensà demetodersomanvändsförattutifrånettstickprovdraslutsatseromenhelpopulation

ST-fredag2017

Page 42: ST-fredag epidemiologi och biostatistik 2017 · PDF fileEpidemiologi ≈ the study of disease occurence in different groups of people and why ≈ forskning där vi observerar och kvantiierar

ST-fredag2017

Populationdensamlingvivilldraslutsatserom

Stickprov=sampleEtturvalurpopulationen

Vianvänderinformationenistickprovetförattdraslutsatserom

populationen

GruppAGruppB Utvärderaeffekt

SlutsatsStatistiskinterferens

Page 43: ST-fredag epidemiologi och biostatistik 2017 · PDF fileEpidemiologi ≈ the study of disease occurence in different groups of people and why ≈ forskning där vi observerar och kvantiierar

Vihittarenskillnad!Bra!Eller…? Vigörenstudie

Skillnad

Verkligskillnad Slumpfel

PowerP-värde

Konaidensintervall

Systematisktfel

BiasConfounding

Ingenskillnad

Slumpfel Systematisktfel

ST-fredag2017

Page 44: ST-fredag epidemiologi och biostatistik 2017 · PDF fileEpidemiologi ≈ the study of disease occurence in different groups of people and why ≈ forskning där vi observerar och kvantiierar

Punktskattningarochkonaidensintervall

Punktskattning(eng:pointestimate)informationfrånstickprovetanvändsföratt

skattaenparameteristudiepopulationen.Enpunktskattningkanvaraettenskiltvärde

ellerandel,mendetkanocksåvaraenskillnadivärdenellerandelarmellanolika

grupper.

Exempel:Viväljerslumpmässigtut100studenterpåKI(=vårtstickprov).Viregistrerarålderförde100studenternaochanvänderderasmedelålderförattgissa–skatta–medelåldernförallastudentervidKI.DettaärenpunktskattningavmedelåldernvidKI

ST-fredag2017

Page 45: ST-fredag epidemiologi och biostatistik 2017 · PDF fileEpidemiologi ≈ the study of disease occurence in different groups of people and why ≈ forskning där vi observerar och kvantiierar

Förattangeosäkerhetenienpunktskattningkanmananvändaettkonaidensintervall

Ommanväljer100stickprovurenstudiepopulationochgenomförsammamätningpå

allastickprovochberäknarett95konGidensintervallförvarjestickprovkanman

förväntasigatt95avkonGidensintervallentäckerdetsannavärdeti

studiepopulationen.

à”ett95konaidensintervalltäckermed95%sannolikhetdetsannavärdetistudiepopulationen”

ST-fredag 2017

Punktskattningarochkonaidensintervall

KI=punktskattningen±konstant·standardfelet.

Page 46: ST-fredag epidemiologi och biostatistik 2017 · PDF fileEpidemiologi ≈ the study of disease occurence in different groups of people and why ≈ forskning där vi observerar och kvantiierar

ExempelkonGidensintervall100studenter

Medelålder31.3

Standardavvikelsen9.7år

95%konGidensintervallfördennapunktskattning

31.3±1.96x(9.7/√100)=31.3±1.9à29.4–33.2

àMedelåldernistudiepopulationen(=allaKIstudenter)med95%sannolikhetliggermellan29.4åroch33.2år

ST-fredag 2017

1)( 2

−∑n

xx

Page 47: ST-fredag epidemiologi och biostatistik 2017 · PDF fileEpidemiologi ≈ the study of disease occurence in different groups of people and why ≈ forskning där vi observerar och kvantiierar

Hypotesprövning

AntagattmanharberäknatettkonGidensintervallochdärmedkunnatkonstateraatt

detsannavärdetistudiepopulationenmed95%sannolikhetliggermellantvåspeciGika

gränsvärden

àvadkanmananvändadennainformationtill???

Medanalytiskstatistikkanmanaldrigbevisanågot.Däremotkanmanavfärdaen

teori–hypotes–sommindretrolig.Förattgöradettaanvändermansigavnågotsom

kallashypotesprövning.

ST-fredag2017

Page 48: ST-fredag epidemiologi och biostatistik 2017 · PDF fileEpidemiologi ≈ the study of disease occurence in different groups of people and why ≈ forskning där vi observerar och kvantiierar

NollhypotesochalternativhypotesNollhypotes(eng:nullhypothesis)=detGinnsingeneffekt,ingenskillnadmellangrupperna,

Alternativhypotes=detainnsenverkligskillnad,detsom”Ginnskvar”ommanförkastarnollhypotesen(kanvaraenkelsidigellerdubbelsidig)

à Vivillkunnaförkastanollhypotesen!

ST-fredag2017

Page 49: ST-fredag epidemiologi och biostatistik 2017 · PDF fileEpidemiologi ≈ the study of disease occurence in different groups of people and why ≈ forskning där vi observerar och kvantiierar

HypotesprövningmedkonaidensintervallNärmangörhypotesprövningmedkonGidensintervallberäknarman

konGidensintervalletfördenpunktskattningmanvilltesta.Enligtdeainitionenav

konaidensintervallskalldetsannavärdetistudiepopulationenmed95%

sannolikhetliggainomkonaidensintervalletsgränser.

à  OmnollhypotesenliggerinomkonGidensintervalletsgränserkanalltsånollhypotesenmycketvälvaradetsannavärdet,ochnollhypotesenkanmedstorsannolikhetstämma.

à  Omnollhypotesendäremotinteliggerinomintervalletsgränserkanmanförkastanollhypotesen,d.v.s.görauttalandetärnollhypotesenärmindretrolig,tillförmånföralternativhypotesen.Närmanharförkastatnollhypotesensägermanattresultatetärstatistisktsigniaikant,ellerstatistisktsäkerställt.

ST-fredag 2017

Page 50: ST-fredag epidemiologi och biostatistik 2017 · PDF fileEpidemiologi ≈ the study of disease occurence in different groups of people and why ≈ forskning där vi observerar och kvantiierar

P-värdeFörutomatttestanollhypotesermedkonDidensintervallkanmanävenanvändap-värde

P-värde=sannolikheten(måsteliggamellan0och1)förattfå detobserveradeutfalletgivetattnollhypotesenärsann (dvsingenskillnad)

≈Sannolikhetenattresultatetberorpåslumpen

Omp-värdetärtillräckligtlitetansermanattdetärorimligtattnollhypotesenärsann,ochalltsåförkastarman

den.DeDinitionenav”tillräckligtliten”kanförståsvariera,mendengränsmansätteruppkallasförtestets

signiDikansnivå,ellerrisknivå.Vanliganivåerär1%(0,01),5%(0,05)och10%(0,10).Detärviktigtattmanredan

innanmanbörjatmeddestatistiskaanalysernaharbestämtsigförvilkensigniDikansnivåmanskallanvända!

ST-fredag2017

Statistisksigniaikansärejlikamedkliniskrelevans!!!

Page 51: ST-fredag epidemiologi och biostatistik 2017 · PDF fileEpidemiologi ≈ the study of disease occurence in different groups of people and why ≈ forskning där vi observerar och kvantiierar

P-värdevskonaidensintervallP-värde

•  Användsvidhypotesprövning

•  Olikametoderberoendepåomdataärnormalfördeladeellerej

ST-fredag2017

Konaidensintervall

•  Användsvidhypotesprövning

•  Uttryckerosäkerhetienskattning

•  Normalfördeladedata

Page 52: ST-fredag epidemiologi och biostatistik 2017 · PDF fileEpidemiologi ≈ the study of disease occurence in different groups of people and why ≈ forskning där vi observerar och kvantiierar

Vihittarenskillnad!Bra!Eller…? Vigörenstudie

Skillnad

Verkligskillnad Slumpfel

PowerP-värde

Konaidensintervall

Systematisktfel

BiasConfounding

Ingenskillnad

Slumpfel Systematisktfel

ST-fredag2017

Page 53: ST-fredag epidemiologi och biostatistik 2017 · PDF fileEpidemiologi ≈ the study of disease occurence in different groups of people and why ≈ forskning där vi observerar och kvantiierar

FelihypotesprövningarNaturligtviskanman,somsagtstidigare,aldrigbevisanågotmedanalytiskstatistik,utanmanlöperhelatidenriskattgörafel

avnågotslag–antingenförkastarmanennollhypotessomintebordehaförkastats,ellersåförkastarmaninteen

nollhypotessombordehaförkastats.Dessatvåfelenbetecknasαochβ.

à  TypIfel:manhittareneffektsomegentligeninteBinns.

à  TypIIfel(β):manintehittareneffektsomfaktisktBinns(samplesize)

Statistiskstyrka(eng:power)betecknarsannolikhetenatthittaeneffektsomBinns,och

beräknasgenom1-β.

ST-fredag2017

VERKLIGHETBehandlinghareffekt

Behandlingharingeneffekt

STUDIENVISAR

Behandlinghareffekt

Bra! α

Behandlingharingeneffekt

β Bra!

Page 54: ST-fredag epidemiologi och biostatistik 2017 · PDF fileEpidemiologi ≈ the study of disease occurence in different groups of people and why ≈ forskning där vi observerar och kvantiierar

”Power–beräkning”(styrkeberäkning)

Uppskattningavhurstorstudienmåstevaraförattupptäckaett

förväntatresultat(exskillnadisjukdomsriskhosexponerade

individerochoexponeradeindivider

ST-fredag 2017

Page 55: ST-fredag epidemiologi och biostatistik 2017 · PDF fileEpidemiologi ≈ the study of disease occurence in different groups of people and why ≈ forskning där vi observerar och kvantiierar

Vihittarenskillnad!Bra!Eller…? Vigörenstudie

Skillnad

Verkligskillnad Slumpfel

PowerP-värde

Konaidensintervall

Systematisktfel

BiasConfounding

Ingenskillnad

Slumpfel Systematisktfel

ST-fredag2017

Page 56: ST-fredag epidemiologi och biostatistik 2017 · PDF fileEpidemiologi ≈ the study of disease occurence in different groups of people and why ≈ forskning där vi observerar och kvantiierar

BiasochconfoundingSystematiskafel(eng:bias)uppstårnärmätresultatenharentendensatt

avvikafråndetsannavärdetpåettsystematisktsätt(dvsallamätvärden

avvikerfråndetsannavärdetpåsammasätt).

•  Selectionbias–felvididentiGieringavstudiepopulationen•  Exmanundersökerenbartdesomfrivilligtanmälersigtill

undersökning.•  Observationorinformationbias–felvidmätningavexponeringellerutfall•  Exs.k.recallbiasifalkontrollstudier,”lättare”attkontrollererinrarsig

attdevaritutsattaförmisstänkaexponeringsfaktorer

ST-fredag2017

Page 57: ST-fredag epidemiologi och biostatistik 2017 · PDF fileEpidemiologi ≈ the study of disease occurence in different groups of people and why ≈ forskning där vi observerar och kvantiierar

Confounding(störfaktor):exponeradeochoexponeradekan

skiljasigmedavseendepåförekomstenavnågonannanfaktor

somisigpåverkarriskenattinsjukna.

ST-fredag 2017

Biasochconfounding

Confounder

Exposure Outcome

1-associeradmedexponeringen2-självständigriskfaktorförsjukdomen3-inteettmellanstegikausalkedjanfrånexponeringtilleffekt(ejEàCàO)

Page 58: ST-fredag epidemiologi och biostatistik 2017 · PDF fileEpidemiologi ≈ the study of disease occurence in different groups of people and why ≈ forskning där vi observerar och kvantiierar

Felkällor

ST-fredag2017

Fullständigprecision–frånvaroavslumpmässigafel.Åtgärdàexempelvisökaantaletindivider,bättremätinstrument

Fullständigvaliditet–frånvaroavsystematiskafel

Page 59: ST-fredag epidemiologi och biostatistik 2017 · PDF fileEpidemiologi ≈ the study of disease occurence in different groups of people and why ≈ forskning där vi observerar och kvantiierar

NormalfördelningEnteoretiskfördelning(≈deGinieradavenmatematiskformel).

Mångafenomeninaturenföljernormalfördelningen,exempelvis

födelsevikter.

Gårfrånminustillplusoändligheten.

Symmetrisk.Ytanunderkurvannär1

DeGinierasutifråntvåfaktorer:

•  medelvärdet

•  standardavvikelsen(=rotenurvariansen)

ST-fredag2017

Page 60: ST-fredag epidemiologi och biostatistik 2017 · PDF fileEpidemiologi ≈ the study of disease occurence in different groups of people and why ≈ forskning där vi observerar och kvantiierar

Normalfördelningforts.

ST-fredag2017

Inomintervalletsomgårfrån1,96standardavvikelserundermedelvärdettill1,96standardavvikelserövermedelvärdetligger95%avobservationerna

Page 61: ST-fredag epidemiologi och biostatistik 2017 · PDF fileEpidemiologi ≈ the study of disease occurence in different groups of people and why ≈ forskning där vi observerar och kvantiierar

Exempelstatistiskatester/modellerParametriskatester/modeller(byggerpåantagandenomhurdata

fördelarsig(oftastnormalfördelningen),skattareneffekt(exskillnadimedelvärde)förvilkenmankanberäknakonDidensintervallochp-värde)

•  Twosamplet-test•  Pairedt-test•  Regressionsanalys•  Variansanalys(ANOVA)

Icke-parametriska:(kananvoberoendeavhurdatafördelarsig,baseraspåobservationernasranger,beräknarendastp-värde)

•  Mann-Whitneytwosampletest•  Chi-2test•  Fischersexaktatest•  Wilcoxonsmatchedpairstest•  Spearman’srankcorrelationcoefGicient

ST-fredag2017

Page 62: ST-fredag epidemiologi och biostatistik 2017 · PDF fileEpidemiologi ≈ the study of disease occurence in different groups of people and why ≈ forskning där vi observerar och kvantiierar

Korrelationskoefaicient

Korrelationärettbegreppinomstatistikensomangerstyrkan

ellerriktningenavettsambandmellan2variabler.Detkallasäven

korrelationskoefGicient.Uttryckssomettsambandmellan1och-1

där0angeringetsamband,

1angermaximaltpossamband

och-1maximaltnegsamband

ST-fredag 2017

Page 63: ST-fredag epidemiologi och biostatistik 2017 · PDF fileEpidemiologi ≈ the study of disease occurence in different groups of people and why ≈ forskning där vi observerar och kvantiierar

Regressionsanalys•  Studerasambandetmellanolikavariabler

•  Centralainomepidemiologiskforskning,multipelregressionsanalyskananvändasförattkontrolleraförförväxlingcondfounder)ochförattskapaprediktionsmodeller

•  DataanvförattbestämmaenekvationellermatematiskmodellsombeskriverhurenutfallsvariabelvarierarsomenfunktionavenellerGleraförklarandevariabler.UtfrånmodellenkansedansambandetmellanvariablernakvantiGieras.

ST-fredag 2017

Page 64: ST-fredag epidemiologi och biostatistik 2017 · PDF fileEpidemiologi ≈ the study of disease occurence in different groups of people and why ≈ forskning där vi observerar och kvantiierar

ST-fredag2017

Page 65: ST-fredag epidemiologi och biostatistik 2017 · PDF fileEpidemiologi ≈ the study of disease occurence in different groups of people and why ≈ forskning där vi observerar och kvantiierar

Sjukdomsförekomst

Incidence–”Hurmångablirsjuka?” àmåttpåhurmångasominsjuknarunderengiventidsperiod

Kumulativincidence(=risk):andelenavenpopulationsominsjuknarunderengiventidsperiod.Antaletinsjuknade/antalfriskavidstart.

Exårligeninsjuknar5%avSverigesbefolkningiinDluensa

Incidencerate:antalnyasjukdomsfallunderengiventidsperiod/totalrisktid.

ExincidensenavMbChronär5per100.000personår.

Prevalens–”Hurmångaärsjuka?” ”Diseasestatus””Diseaseburdeninapopulation”

àproportionenavpopulationensomharensjukdom(elleregenskap)videttgivettillfälle

ST-fredag2017

Page 66: ST-fredag epidemiologi och biostatistik 2017 · PDF fileEpidemiologi ≈ the study of disease occurence in different groups of people and why ≈ forskning där vi observerar och kvantiierar

AssociationsmåttJämförelsemellanexponeradeochickeexponeradegrupper(exponering=t.ex.enspeciGikbehandling)

Absolutaochrelativamått•  Riskdifferens•  Relativrisk:indikerarsannolikhetenattutvecklasjukdom(outcome)iexponeradgruppjämförtmedoexponeradgrupp

•  OddsRatio•  HazardRatio

ST-fredag2017

Page 67: ST-fredag epidemiologi och biostatistik 2017 · PDF fileEpidemiologi ≈ the study of disease occurence in different groups of people and why ≈ forskning där vi observerar och kvantiierar

Sensitivitet/speciaicitetSensitivitet=sannolikhetenattensjukindividblirklassiGiceradsomsjuk

Speciaicitet=sannolikhetenattenfriskindividblirklassiGiceradsomfrisk

PositivtochnegativtprediktivtvärdeSannolikhetenförsjukdom,givetetttestresultat,kallasförtestetsprediktivavärde.

Positivtprediktivtvärde=sannolikhetenattenindividmedett"sjukt"provsvar verkligenärsjuk

Negativtprediktivtvärde=sannolikhetenattenindividmedett"friskt"provsvar verkligenärfrisk

ST-fredag2017

Page 68: ST-fredag epidemiologi och biostatistik 2017 · PDF fileEpidemiologi ≈ the study of disease occurence in different groups of people and why ≈ forskning där vi observerar och kvantiierar

ST-fredag2017

Sjuk Frisk

Sjuk A B

Frisk C D

SensitivitetA/(A+C)

SpeciaicitetD/(B+D)

PospredvärdeA/(A+B)

NegpredvärdeD/(C+D)

Verklighet

Test

Page 69: ST-fredag epidemiologi och biostatistik 2017 · PDF fileEpidemiologi ≈ the study of disease occurence in different groups of people and why ≈ forskning där vi observerar och kvantiierar

ST-fredag2017

läkartidningen nr 9–10 2013 volym 110470

Biostatistik är en integrerad och central del av epidemiologin, och biostatistiska metoder används vid såväl planering som analys av epidemiologiska studier.

Innan en studie genomförs används s!k styrkeberäkningar (power-beräkningar) för att uppskatta hur stor studien måste vara för att kunna upptäcka ett förväntat resultat, t!ex en viss skillnad i sjukdomsrisk hos individer med (exponerade) och utan (oexponerade) en viss egenskap eller levnadsvana. När studiematerialet väl är insamlat används andra metoder för att beskriva materialet och beräkna relativa risker och and ra riskmått samt för att uppskatta inverkan av slumpmässiga fel i studien. Ytterligare metoder finns för att undersöka om ett samband mellan en exponering och ett utfall i själva verket förklaras av en tredje faktor – en s!k förväxlingsfaktor (con-founder) (Fakta 1). Därutöver finns fler mer avancerade bio-statistiska metoder.

Artikeln ger en introduktion till grundläggande biostatis-tiska metoder och begrepp som flitigt används i epidemiolo-

giska studier. Texten fokuserar på observationella kliniska studier, men flera av koncepten är relevanta även för rando-miserade kliniska studier.

Deskriptiv statistikDeskriptiv statistik används för att sammanställa studiema-terial med hjälp av tabeller, figurer och olika former av sam-manfattande mått, såsom medelvärden och procenttal. En koncis och informativ sammanställning kan ge god överblick över ett stort studiematerial, peka på trender i materialet och ge ledtrådar om hur man bör gå vidare med mer avancerade analyser.

Vilka former av sammanfattande mått som används i den deskriptiva sammanställningen beror på vilka typer av va-riabler som ingår i materialet. Det finns två huvudgrupper av variabler: kategoriska variabler (som etnicitet eller kön) och numeriska variabler (som ålder eller kroppsvikt). Kategoriska variabler beskrivs oftast med andelen eller antalet individer i respektive kategori. För numeriska variabler beräknas i stäl-let ofta ett centralmått och ett spridningsmått; centralmåttet beskriver variabelns »tyngdpunkt«, medan spridningsmåttet

Q klinik & vetenskap verktyg för klinisk forskning (9/14)

Biostatistik har en central roll i epidemiologiIntroduktion till begrepp och metoder utifrån kliniska observationella studier

��QsammanfattatBiostatistik är en central del av epidemiologisk forskning. Deskriptiv statistik används för att sammanställa studiemate-rial med hjälp av tabeller, figu-rer och olika sammanfattande mått, såsom medelvärden och procenttal.Regressionsanalys används ofta för att beräkna absoluta och relativa risker; riskmåtten speglar styrkan av sambandet mellan en exponering och före-komsten av ett visst utfall.

Inverkan av slumpmässiga fel i en studie kan kvantifieras med hjälp av P-värden och konfi-dens intervall. Vid statistisk slutledning tolkas huvudresultatet (riskmåttet) i ljuset av inverkan av slumpmäs-siga fel i studien. Statistik slutledning är bara en del av tolkningen av ett studie-resultat.

ANDREAS PETTERSSON, med dr, leg läkare, enheten för klinisk epidemiologi, Karolinska insti-tutet, Stockholm; Department of Epidemiology, Harvard School of Public Health, Bos-ton, MA, USA [email protected] GORDON, doktorand, spe-cialistläkare i ortopedi, institu-tionen för kliniska vetenskaper, Danderyds sjukhus, Karolinska institutet, Stockholm

GUSTAF EDGREN, docent, AT-lä-kare, Department of Epidemiol-ogy, Harvard School of Public Health, Boston, MA, USA PAUL W DICKMAN, PhD, univer-sitetslektor i biostatistik; de båda sistnämnda institutionen för medicinsk epidemiologi och biostatistik, Karolinska institu-tet, Stockholm

��Qfakta 1. FörväxlingFörväxling (confounding) innebär att sambandet mel-lan en exponering och ett utfall i själva verket helt el-ler delvis förklaras av att exponeringen samvarierar med en annan exponering (förväxlingsfaktor) som di-rekt eller indirekt orsakar utfallet man är intresserad av. Till exempel skulle ett sam-band mellan rökning (expo-nering) och koloncancer (ut-fall) helt eller delvis kunna förklaras av (vara »förväx-lat« med) att rökare äter mer rött kött än icke-rökare och att intag av rött kött (förväx-lingsfaktor) i sin tur orsakar koloncancer. En förväxlingsfaktor har tre

egenskaper, den• samvarierar med expone-

ringen• orsakar utfallet direkt el-

ler indirekt• är inte en del av orsaks-

kedjan mellan expone-ringen och utfallet.

En fördel med randomisera-de kliniska studier jämfört med observationella klinis-ka studier är att randomise-ringen i sig minimerar risken för förväxling, eftersom del-tagarna slumpmässigt ran-domiseras till att exponeras eller inte. Exponeringen samvarierar därmed inte med någon förväxlingsfak-tor, utan är slumpmässigt fördelad.

»Verktyg för klinisk forskning« är en artikelserie som omfattar 14 artiklar om grundläggande principer för hur man planerar och ge-nomför kliniska forskningsstudier. Serien startade i nr 3/2013.

Illus

trat

ion:

Jako

b Ro

bert

sson

/Typ

ofor

m

Page 70: ST-fredag epidemiologi och biostatistik 2017 · PDF fileEpidemiologi ≈ the study of disease occurence in different groups of people and why ≈ forskning där vi observerar och kvantiierar

ST-fredag2017

Page 71: ST-fredag epidemiologi och biostatistik 2017 · PDF fileEpidemiologi ≈ the study of disease occurence in different groups of people and why ≈ forskning där vi observerar och kvantiierar

ST-fredag 2017

Page 72: ST-fredag epidemiologi och biostatistik 2017 · PDF fileEpidemiologi ≈ the study of disease occurence in different groups of people and why ≈ forskning där vi observerar och kvantiierar

Omtidsnöd–vadskajagfokuserapåinförtentan?•  Datanivåer•  Central-ochspridningsmått

•  P-värde/konGidensintervall•  Bias/confounding

•  Normalfördelning

ST-fredag2017

Page 73: ST-fredag epidemiologi och biostatistik 2017 · PDF fileEpidemiologi ≈ the study of disease occurence in different groups of people and why ≈ forskning där vi observerar och kvantiierar

In designing a study:

a)Power analysis should be carried out before starting a study to find out the number of cases to be included in the study.

Correct Answer: Trueb)Power of the study should be at least 95%.

Correct Answer: FalsePower analysis is performed to determine the sample size required to show a certain difference. Power= 1-beta, where beta=type II error. The power of the study should be at least 80%. This means there should be at least an 80% chance of detecting a difference, if a difference exists.c)Cross over design is the most common method of controlling.

Correct Answer: FalseThe two groups method is the most common method of controlling. One group receives the study drug (for example) and the other acts as a control.d)The level of significance (p value) chosen is always 0.05%.

Correct Answer: FalseA probability of less than 0.05 represents statistical significance. However, more stringent levels of probability are sometimes used for example P<0.01e)Blinding and Randomisation helps in reducing Bias.

Correct Answer: TruePatients are randomly allocated to one or the other group in order to reduce the chances of bias towards one or the other treatment.

ST-fredag 2017

Page 74: ST-fredag epidemiologi och biostatistik 2017 · PDF fileEpidemiologi ≈ the study of disease occurence in different groups of people and why ≈ forskning där vi observerar och kvantiierar

Regarding Statistical Distribution of data:

a)In skewed data, non parametric tests are more appropriate.

Correct Answer: Trueb)In normal distribution, Mean, Median and Mode have same value.

Correct Answer: Truec)In Gaussean distribution, one Standard Deviation below and above mean includes 63% of data.

Correct Answer: FalseFor data which is normally distributed, 68% of them will fall between 1SD on either side of the mean, 95% within 1.96SD and 99% within 3SD.d)Nominal and Ordinal data which are normally distributed are Parametric data.

Correct Answer: FalseInterval or ratio data, which are normally distributed are called parametric data. All other data (Nominal, Ordinal) are called non-parametric.e)Student t test can be used for normally distributed interval data.

Correct Answer: True

ST-fredag 2017

Page 75: ST-fredag epidemiologi och biostatistik 2017 · PDF fileEpidemiologi ≈ the study of disease occurence in different groups of people and why ≈ forskning där vi observerar och kvantiierar

Tvåvariabler

�Iblandvillmanundersökaomtvåvariabler

”hängerihop”

�Exempelmaterial:

�195manligayrkesGiskaremellan31och59år

�BlodanalyseratförPCBochHg

�HarenGiskaremedhögtPCBocksåhögtHg?

�Barasamvariation→korrelation

�Enpåverkardenandra→linjärregression

Korrelationskoefficienter används för att visa hur två

variabler samvarierar

� För normalfördelade data används Pearsons

korrelationskoefficient (r)

� För övriga data används Spearmans

korrelationskoefficient (rS)

ST-fredag 2017

Page 76: ST-fredag epidemiologi och biostatistik 2017 · PDF fileEpidemiologi ≈ the study of disease occurence in different groups of people and why ≈ forskning där vi observerar och kvantiierar

� Om en variabel påverkar den andra använder

man linjär regression

� Exempel: Om y alltid är samma som x kan

man skriva y = x

� Exempel: Om y alltid är dubbelt så stor som x

kan man skriva y = 2x

� y kallas för den beroende variabeln

� x kallas för den oberoende variabeln

En generell formel för sambandet mellan y

och x kan skrivas y = βx

� β kallas för ekvationens riktningskoefficient

eller lutningskoefficient (slope)

� Tolkningen av β är

� För varje enhet x ökar, ökar y β enheter

� En individ med en enhet högre x har β enheter

högre y

� β kan vara negativ = minskning

ST-fredag 2017

Förvarjevärdepåxmåsteyvaranormalfördelad�Samtligaobservationermåstevaraoberoende�Förhållandetmellanxochymåstevaralinjärt

Page 77: ST-fredag epidemiologi och biostatistik 2017 · PDF fileEpidemiologi ≈ the study of disease occurence in different groups of people and why ≈ forskning där vi observerar och kvantiierar

The Normal Distribution The Central Limit Theorem The p-value Standard Error of the Mean Type I and II Errors Power of a Statistical Test One versus Two-tailed Tests

Bayesiansk statistik

ST-fredag 2017

Page 78: ST-fredag epidemiologi och biostatistik 2017 · PDF fileEpidemiologi ≈ the study of disease occurence in different groups of people and why ≈ forskning där vi observerar och kvantiierar

ST-fredag 2017

Deegenskapersombeskrivsovanharanväntsförattkonstruerastatistiskatest.Eftersomdessatestbyggerpåbl.a.

normalfördelningensparametrarkallasdeförparametriskatest(eng:parametricaltests).Förattparametriska

testskallkunnaanvändasmåstedetdatamaterialmananalyserarhasammaegenskaperdenfördelningpåvilkentestenärbaserade,d.v.s.datamåstevaranormalfördelade.(DetGinns

ävenandrateoretiskafördelningarpåvilkastatistiskatestärbaserade,mendettaingårinteikursen.)