Cohorte : différents types d ’étudesCohorte : différents types d ’études Principe : comparer la morbidité (ou la mortalité) observée dans un ou plusieurs groupes d ’individus

Cohorte : différents types d ’étudesPrincipe :

comparer la morbidité (ou la mortalité) observée dans un ou plusieurs groupes d ’individus initialement indemnes de la maladie et définis en fonction de leur exposition à un facteur de risque soupçonné de la maladie

Les différentes catégories de cohortes sont définies par rapport aux modes de constitution des groupes

Suivi de populationEnquêtes « exposés/non exposés » , pour des facteurs d ’exposition rares (ex :en milieu professionnel )Études sur la mortalité avec groupe de comparaison externe

Suivi de populationSuivre des sujets exposés et non exposés issus d ’une population de référenceS ’applique bien aux expositions fréquentesPermet l ’estimation du risque relatif par comparaison INTERNE des exposés au non exposés Généralement analysé avec des méthodes statistiques de survieEx : relation entre tabac et cancer des bronches

Modèle

échantillon

E+

E-POPULATIONREFERENTE

“cohorte”

E+

E-

Enquêtes exposés/non exposésChoisir un groupe de sujets exposés et les suivreEt prendre un groupe de comparaison non exposésuivis selon les mêmes modalitésS ’applique bien aux expositions rares et particulièrement en milieu professionnelLa fréquence de l ’exposition en population n ’est pas estimée (pas de RA)Ex : relation benzène-cancer

Modèle

échantillon

E+

POPULATIONREFERENTE E+

E-

E-

Etude sur la mortalité avec groupe de comparaison externe

Suivre une population exposée et compter les décèsPrendre comme groupe de comparaison la population généraleExpression du résultat sous forme de SMR (SIR si la morbidité est étudiée)Ne peut être appliqué (comme tel) si l ’exposition est fréquente dans la population généraleEx : mortalité par leucémie des patients autour des sites nucléaires

Modèle

échantillon

E+

POPULATIONREFERENTE E+

E-

E+

E-

Cohorte prospective vs cohorte rétrospective

M

E

début de l'exposition

inclusion des sujetsinclusion des sujetscohorte "prospective" recherche exposition antérieure (chez tous)

cohorte "historique" ou ("rétrospective")

Cas-témoinssélection de Cas (sujets malades)sélection de sujets Témoins: ceux-ci doivent être représentatifs de la population de référence dont sont issus les casrecherche rétrospective des expositions aux différents facteurs de risque

cas particuliersÉtude cas-témoins emboîtées dans une cohorteCas-cohorteÉtude « taux d ’attaque secondaire »

InférenceLe modèle

POPULATIONREFERENTE M+

M-

“cas-témoin”

M+

M-

constitution de la cohorte

sélection du groupe “exposés”identification de la population exposée ;définition claire de l’exposition et son intensité ;

sélection du groupe “non-exposés”groupe comparable sauf pour l’exposition;mêmes méthodes et même durée de suivi ;

13F Carrat/ formation GEE

Smoking & death in British doctors aged 70-89 during the 1950s, 1970s & 1990s:large improvement among non-smokerswholly nullified among cigarette smokers

Period studied Prob. survival from 70-90(& mean birth year) Non-smoker Cigt Smoker1950s (1875) 12% 10% 1970s 20% 7%1990s (1915) 33% 7%

Doll, Peto et al. BMJ 26/06/04

limitesbiais (de sélection)facteurs de confusionerreurs statistiques

tests multipleseffectifs insuffisants

biais de sélection

perdus de vue et absences pendant l’enquêteils ne sont pas nécessairement répartis aléatoirement

choix des non-exposésdifférence entre les exposés et les non-exposés sur des caractéristiques (autres que l’exposition) qui influencent la survenue de la maladiemode de suivi différent entre les 2 groupes

organisation

un protocole écritune définition des populations sources et de l’échantillonune définition précise de l’exposition, de la non-expositiondes critères d’inclusion et d’exclusion identiques chez les exposés et les non-exposésdes conditions de suivi semblablesune organisation logistique pour permettre le suivi des sujetsdes modalités d’évaluation diagnostiques identiquesdes précautions prises vis-à-vis des biais de sélectionles facteurs de confusion connus pris en comptecalcul du nombre de sujets nécessaire

Quand faire une enquête de cohorte ?

classiquement, lorsque :la maladie n’est pas de survenue trop rare;le temps de latence n’est pas trop long;les populations sont faciles à suivre;on veut estimer la fréquence de la maladie.

pour une plus grande efficacité...

prendre la population générale comme référencesi l’exposition est rare ;

choisir une population d’étude couverte par un registreréaliser des enquêtes de cohorte historiquesréaliser des enquêtes cas-témoins nichées dans la cohorterecourir aux grandes bases de données (record linkage)

Quelques mots sur les biais (à connaître+++)Dépistage

Lead-time biasLength-time bias

Paradoxe de SimpsonClass bias

Début

A

Diagnosticprécocepossible

B C

Diagnosticprécoceeffectué

D

Diagnosticbasé sur lesSymptômes

F

Evén

emen

t(e

.g.,

mor

t,re

curre

nce)

Phase précliniquedétectable

Survie après diagnostic précoce

Survie après diagusuel

Lead Time

Biais dans les études de dépistage: Length –time bias

La plupart des maladies chroniques neprogressent pas de la même manière chez l’ensemble des individus

Le dépistage va préférentiellementsélectionner des progresseurs “lents” (plus longue période pendant laquelle ils peuventêtre dépistés ) qui ont généralement une plus lente progression vers l’événement

Paneth

Length-time bias

Length-time bias

Biais de participation

Notions de causalité

Pourquoi?

Essai contrôlé: inférence causale possible – pourquoi?Observance imparfaite: intention de traiter?

Etude épidémiologique (données observées non contrôlées): associations statistiques (corrélations) –causales?

Facteurs de confusion, ajustement (causalité implicite)

Selon Pearl:Les hypothèses causales sont implicites dans nos raisonnements

Relations causales: intuitives (qualitatives) Dépendance/indépendance en probabilité: PAS intuitive (dépend de la loi…)

Un modèle probabiliste/statistique ne permet pas l’inférence causale (critères de Bradford Hill?)Pour parler causalité il faut utiliser (expliciter) un modèle causal

Pearl propose un formalisme (symboles, règles de calcul)

Exemple

Soient variables binairesA: rhume; B: rhinite allergique; C: nez bouché; D: se moucherOn observe le pattern: (A || B), (D || (A,B) |C)

Tous les diagrammes compatibles avec ce pattern comportent C D

B B*

C

A

D

CA

D

C B

D

*A

EssaisObservation: on peut pas calculer l’effet du traitement (modèle non identifiable):

on n’estime pas nécessairement l’effet causal en conditionnant sur le traitement

Essai contrôlé: effet causal = effet conditionnelLe tirage au sort de l’attribution d’un traitement mutile le graphe: sectionne toutes les flèches incidentes de la variable traitement…

Essais

Essai contrôléObservation

Traitement Random

U* U*Traitement

Traitement

RéponseRéponse

U*: variables latentes (non observées)

Facteurs de confusionSi l’on veut estimer l’effet de X sur Y, on doit s’assurer que l’association (statistique) observée ne résulte pas d’interactions avec d’autres facteurs

Facteurs de confusionPour que Z soit un facteur de confusion il faut

Rothman et GreenlandZ est un facteur de risque pour Y (marqueur d’une cause de Y, indépendamment de X)Z est associée à XZ n’est affectée ni par X ni par Y (en particulier: n’est pas un intermédiaire sur le chemin causal de X à Y)

Pearl (synthèse)Z n’est pas affectée par XZ est associée à XZ est associée a Y, conditionnellement à X

Le paradoxe de Simpsonhommes guéris total % guéris

traitement 18 30 60

pas traitement

7 10 70

25 40

population guéris total % guéris

traitement 20 40 50

pas traitement

16 40 40

36 80

femmes guéris total % guéris

traitement 2 10 20

pas traitement

9 30 30

11 40

)F,T P(G|) FP(G|T,,F)T P(G|P(G|T,F)

)T P(G|P(G|T)

<

<

>

SimpsonRemarque: Le paradoxe n’en est un que si l’on fait une lecture causale (intuitive) des résultatsIl existe donc des facteurs de confusion…

Les hommes guérissent (indépendamment du traitement) plus souvent que les femmessont traités plus souvent que les femmes

Donc un patient tiré au sort et traité a une forte probabilité d’être un homme, et donc de guérir…

Si randomisation alors

)F,T P(G|) FP(G|T,,F)T P(G|P(G|T,F)

)T P(G|P(G|T)

<

<

>hommes guéris total % guéris

traitement 12 20 60

pas traitement

14 20 70

26 40population guéris total % guéris

traitement 16 40 40

pas traitement

20 40 50

36 80

femmes guéris total % guéris

traitement 4 20 20

pas traitement

6 20 30

10 40

Simpson

La solution dépend des hypothèses causales

U*

T

F(sexe)

G

T

F

G

T

F (TA)V*

G

Ne pas ajusterAjuster

Modèles (causaux) marginaux structurauxJames M. Robins, Miguel A. Hernan & Babette BrumbackEn analyse de données longitudinales, méthodologiepermettant l’estimation de l’effet d’un traitement en présencede biais de confusion dépendant du temps ( “time-dependent confounding”) Un biais de confusion dépendant du temps doit être suspectéquand:

Covariable dépendante du temps (ex: CD4)Associée à la variable réponse (ex: guérison, survie)Associée à l’exposition d’intérêt (ex: traitement)

L’exposition d’intérêt est un prédicteur de la covariable

Principes de la méthodeChaque sujet a deux réponses au traitement :

Une qui serait observée en cas de traitement (Y1i) Une qui serait observée en l’absence de traitement (Y0i).

On ne peux jamais observer la même personne simultanément=> on ne peut pas observer chacune des réponses possibles

Inférence causaleL’effet causal d’un traitement est la différence des réponses

Y1i – Y0i

L’effet causal moyen est :

E[Y1 – Y0] = E[Y1] – E[Y0]

ProblèmeLorsque des traitements sont offerts à un instant précis et unique sans randomisation, il est possible d’ajuster sur les covariables induisant un biais de confusion en les incluant dansun modèle de régression ( type GLM, Cox)

Lorsque ces traitements sont offerts à de multiples et différentsmoments, ces ajustements ne permettent plus d’éviter les biais

Problème

L0

A0 YA1

L1

Y est la variable réponseA traitementL covariable

IPTW -Inverse Probability of Treatment Weighting

Les modèles marginaux structuraux sont estimés en utilisantune méthode de pondération basée sur l’inverse de la probabilité traitement

IPTW calcule sur chaque intervalle de temps, la probabilitéqu’un individu reçoive le traitement conditionellement au traitement antérieur, et au traitement antérieur et aux covariables

Ces probabilités estimées sont utilisées pour pondérer chaqueindividus dans l’échantillon dans le modèle de la variable réponse

Expression des poids:

A(k) indicatrice traitement au temps kA(k-1) historique du traitement jusqu’au temps k-1 L(k) vecteur de s covariables au temps kL(k-1) historique des covariables jusqu’au temps k-1V vecteur de covariables non dépendantes du temps

Modèle de la variable réponseUn modèle de type GEE (logistique) est utilisé pour la variable réponse

Matrice de corrélation (identité)

Les observations sont pondérées par les poids

VtAtVtAtYtYit 210 )1()()),1(,0)1(1)(Pr(log βββ +−+=−=−=

SAS CodeHernan et al. Epidemiology 2000;11:561-570Un exemple

Sterne JA. Lancet 2005;366:378

Ortqvist, Eur Resp J 2007

Documents

Cohorte : différents types d ’étudesCohorte : différents types d ’études Principe : comparer la morbidité (ou la mortalité) observée dans un ou plusieurs groupes d ’individus