Upload
others
View
19
Download
0
Embed Size (px)
Citation preview
Cohorte : différents types d ’étudesPrincipe :
comparer la morbidité (ou la mortalité) observée dans un ou plusieurs groupes d ’individus initialement indemnes de la maladie et définis en fonction de leur exposition à un facteur de risque soupçonné de la maladie
Les différentes catégories de cohortes sont définies par rapport aux modes de constitution des groupes
Suivi de populationEnquêtes « exposés/non exposés » , pour des facteurs d ’exposition rares (ex :en milieu professionnel )Études sur la mortalité avec groupe de comparaison externe
Suivi de populationSuivre des sujets exposés et non exposés issus d ’une population de référenceS ’applique bien aux expositions fréquentesPermet l ’estimation du risque relatif par comparaison INTERNE des exposés au non exposés Généralement analysé avec des méthodes statistiques de survieEx : relation entre tabac et cancer des bronches
Modèle
échantillon
E+
E-POPULATIONREFERENTE
“cohorte”
E+
E-
Enquêtes exposés/non exposésChoisir un groupe de sujets exposés et les suivreEt prendre un groupe de comparaison non exposésuivis selon les mêmes modalitésS ’applique bien aux expositions rares et particulièrement en milieu professionnelLa fréquence de l ’exposition en population n ’est pas estimée (pas de RA)Ex : relation benzène-cancer
Modèle
échantillon
E+
POPULATIONREFERENTE E+
E-
E-
Etude sur la mortalité avec groupe de comparaison externe
Suivre une population exposée et compter les décèsPrendre comme groupe de comparaison la population généraleExpression du résultat sous forme de SMR (SIR si la morbidité est étudiée)Ne peut être appliqué (comme tel) si l ’exposition est fréquente dans la population généraleEx : mortalité par leucémie des patients autour des sites nucléaires
Modèle
échantillon
E+
POPULATIONREFERENTE E+
E-
E+
E-
Cohorte prospective vs cohorte rétrospective
M
E
début de l'exposition
inclusion des sujetsinclusion des sujetscohorte "prospective" recherche exposition antérieure (chez tous)
cohorte "historique" ou ("rétrospective")
Cas-témoinssélection de Cas (sujets malades)sélection de sujets Témoins: ceux-ci doivent être représentatifs de la population de référence dont sont issus les casrecherche rétrospective des expositions aux différents facteurs de risque
cas particuliersÉtude cas-témoins emboîtées dans une cohorteCas-cohorteÉtude « taux d ’attaque secondaire »
InférenceLe modèle
POPULATIONREFERENTE M+
M-
“cas-témoin”
M+
M-
constitution de la cohorte
sélection du groupe “exposés”identification de la population exposée ;définition claire de l’exposition et son intensité ;
sélection du groupe “non-exposés”groupe comparable sauf pour l’exposition;mêmes méthodes et même durée de suivi ;
13F Carrat/ formation GEE
Smoking & death in British doctors aged 70-89 during the 1950s, 1970s & 1990s:large improvement among non-smokerswholly nullified among cigarette smokers
Period studied Prob. survival from 70-90(& mean birth year) Non-smoker Cigt Smoker1950s (1875) 12% 10% 1970s 20% 7%1990s (1915) 33% 7%
Doll, Peto et al. BMJ 26/06/04
limitesbiais (de sélection)facteurs de confusionerreurs statistiques
tests multipleseffectifs insuffisants
biais de sélection
perdus de vue et absences pendant l’enquêteils ne sont pas nécessairement répartis aléatoirement
choix des non-exposésdifférence entre les exposés et les non-exposés sur des caractéristiques (autres que l’exposition) qui influencent la survenue de la maladiemode de suivi différent entre les 2 groupes
organisation
un protocole écritune définition des populations sources et de l’échantillonune définition précise de l’exposition, de la non-expositiondes critères d’inclusion et d’exclusion identiques chez les exposés et les non-exposésdes conditions de suivi semblablesune organisation logistique pour permettre le suivi des sujetsdes modalités d’évaluation diagnostiques identiquesdes précautions prises vis-à-vis des biais de sélectionles facteurs de confusion connus pris en comptecalcul du nombre de sujets nécessaire
Quand faire une enquête de cohorte ?
classiquement, lorsque :la maladie n’est pas de survenue trop rare;le temps de latence n’est pas trop long;les populations sont faciles à suivre;on veut estimer la fréquence de la maladie.
pour une plus grande efficacité...
prendre la population générale comme référencesi l’exposition est rare ;
choisir une population d’étude couverte par un registreréaliser des enquêtes de cohorte historiquesréaliser des enquêtes cas-témoins nichées dans la cohorterecourir aux grandes bases de données (record linkage)
Quelques mots sur les biais (à connaître+++)Dépistage
Lead-time biasLength-time bias
Paradoxe de SimpsonClass bias
Début
A
Diagnosticprécocepossible
B C
Diagnosticprécoceeffectué
D
Diagnosticbasé sur lesSymptômes
F
Evén
emen
t(e
.g.,
mor
t,re
curre
nce)
Phase précliniquedétectable
Survie après diagnostic précoce
Survie après diagusuel
Lead Time
Biais dans les études de dépistage: Length –time bias
La plupart des maladies chroniques neprogressent pas de la même manière chez l’ensemble des individus
Le dépistage va préférentiellementsélectionner des progresseurs “lents” (plus longue période pendant laquelle ils peuventêtre dépistés ) qui ont généralement une plus lente progression vers l’événement
Paneth
Length-time bias
Length-time bias
Biais de participation
Notions de causalité
Pourquoi?
Essai contrôlé: inférence causale possible – pourquoi?Observance imparfaite: intention de traiter?
Etude épidémiologique (données observées non contrôlées): associations statistiques (corrélations) –causales?
Facteurs de confusion, ajustement (causalité implicite)
Selon Pearl:Les hypothèses causales sont implicites dans nos raisonnements
Relations causales: intuitives (qualitatives) Dépendance/indépendance en probabilité: PAS intuitive (dépend de la loi…)
Un modèle probabiliste/statistique ne permet pas l’inférence causale (critères de Bradford Hill?)Pour parler causalité il faut utiliser (expliciter) un modèle causal
Pearl propose un formalisme (symboles, règles de calcul)
Exemple
Soient variables binairesA: rhume; B: rhinite allergique; C: nez bouché; D: se moucherOn observe le pattern: (A || B), (D || (A,B) |C)
Tous les diagrammes compatibles avec ce pattern comportent C D
B B*
C
A
D
CA
D
C B
D
*A
EssaisObservation: on peut pas calculer l’effet du traitement (modèle non identifiable):
on n’estime pas nécessairement l’effet causal en conditionnant sur le traitement
Essai contrôlé: effet causal = effet conditionnelLe tirage au sort de l’attribution d’un traitement mutile le graphe: sectionne toutes les flèches incidentes de la variable traitement…
Essais
Essai contrôléObservation
Traitement Random
U* U*Traitement
Traitement
RéponseRéponse
U*: variables latentes (non observées)
Facteurs de confusionSi l’on veut estimer l’effet de X sur Y, on doit s’assurer que l’association (statistique) observée ne résulte pas d’interactions avec d’autres facteurs
Facteurs de confusionPour que Z soit un facteur de confusion il faut
Rothman et GreenlandZ est un facteur de risque pour Y (marqueur d’une cause de Y, indépendamment de X)Z est associée à XZ n’est affectée ni par X ni par Y (en particulier: n’est pas un intermédiaire sur le chemin causal de X à Y)
Pearl (synthèse)Z n’est pas affectée par XZ est associée à XZ est associée a Y, conditionnellement à X
Le paradoxe de Simpsonhommes guéris total % guéris
traitement 18 30 60
pas traitement
7 10 70
25 40
population guéris total % guéris
traitement 20 40 50
pas traitement
16 40 40
36 80
femmes guéris total % guéris
traitement 2 10 20
pas traitement
9 30 30
11 40
)F,T P(G|) FP(G|T,,F)T P(G|P(G|T,F)
)T P(G|P(G|T)
<
<
>
SimpsonRemarque: Le paradoxe n’en est un que si l’on fait une lecture causale (intuitive) des résultatsIl existe donc des facteurs de confusion…
Les hommes guérissent (indépendamment du traitement) plus souvent que les femmessont traités plus souvent que les femmes
Donc un patient tiré au sort et traité a une forte probabilité d’être un homme, et donc de guérir…
Si randomisation alors
)F,T P(G|) FP(G|T,,F)T P(G|P(G|T,F)
)T P(G|P(G|T)
<
<
>hommes guéris total % guéris
traitement 12 20 60
pas traitement
14 20 70
26 40population guéris total % guéris
traitement 16 40 40
pas traitement
20 40 50
36 80
femmes guéris total % guéris
traitement 4 20 20
pas traitement
6 20 30
10 40
Simpson
La solution dépend des hypothèses causales
U*
T
F(sexe)
G
T
F
G
T
F (TA)V*
G
Ne pas ajusterAjuster
Modèles (causaux) marginaux structurauxJames M. Robins, Miguel A. Hernan & Babette BrumbackEn analyse de données longitudinales, méthodologiepermettant l’estimation de l’effet d’un traitement en présencede biais de confusion dépendant du temps ( “time-dependent confounding”) Un biais de confusion dépendant du temps doit être suspectéquand:
Covariable dépendante du temps (ex: CD4)Associée à la variable réponse (ex: guérison, survie)Associée à l’exposition d’intérêt (ex: traitement)
L’exposition d’intérêt est un prédicteur de la covariable
Principes de la méthodeChaque sujet a deux réponses au traitement :
Une qui serait observée en cas de traitement (Y1i) Une qui serait observée en l’absence de traitement (Y0i).
On ne peux jamais observer la même personne simultanément=> on ne peut pas observer chacune des réponses possibles
Inférence causaleL’effet causal d’un traitement est la différence des réponses
Y1i – Y0i
L’effet causal moyen est :
E[Y1 – Y0] = E[Y1] – E[Y0]
ProblèmeLorsque des traitements sont offerts à un instant précis et unique sans randomisation, il est possible d’ajuster sur les covariables induisant un biais de confusion en les incluant dansun modèle de régression ( type GLM, Cox)
Lorsque ces traitements sont offerts à de multiples et différentsmoments, ces ajustements ne permettent plus d’éviter les biais
Problème
L0
A0 YA1
L1
Y est la variable réponseA traitementL covariable
IPTW -Inverse Probability of Treatment Weighting
Les modèles marginaux structuraux sont estimés en utilisantune méthode de pondération basée sur l’inverse de la probabilité traitement
IPTW calcule sur chaque intervalle de temps, la probabilitéqu’un individu reçoive le traitement conditionellement au traitement antérieur, et au traitement antérieur et aux covariables
Ces probabilités estimées sont utilisées pour pondérer chaqueindividus dans l’échantillon dans le modèle de la variable réponse
Expression des poids:
A(k) indicatrice traitement au temps kA(k-1) historique du traitement jusqu’au temps k-1 L(k) vecteur de s covariables au temps kL(k-1) historique des covariables jusqu’au temps k-1V vecteur de covariables non dépendantes du temps
Modèle de la variable réponseUn modèle de type GEE (logistique) est utilisé pour la variable réponse
Matrice de corrélation (identité)
Les observations sont pondérées par les poids
VtAtVtAtYtYit 210 )1()()),1(,0)1(1)(Pr(log βββ +−+=−=−=
SAS CodeHernan et al. Epidemiology 2000;11:561-570Un exemple
Sterne JA. Lancet 2005;366:378
Ortqvist, Eur Resp J 2007