Valeurs diagnostiques des examens complémentaires (imagerie, biologie…)
F. KOHLER N’Djamena 2011
La décision?
Problème général Le juge : Innocent ou coupable ?
Risque de condamner un innocent Risque de laisser échapper un coupable
Le médecin : Atteint de la maladie ou non ?
Risque de ne pas traiter le malade Risque de traiter à tort le malade
Exemple : Décider : Pile ou face ou.. ?
Le problème : Mme X, 30 ans est elle
enceinte ? Vous savez que 20% des
femmes de 30 ans sont enceintes. Vous décider que si en jetant une pièce de monnaie celle-ci tombe sur pile vous lui direz qu’elle est enceinte que si c’est face elle ne l’est pas.
Quels résultats obtenez vous ?
3
EnceinteNon
enceinte TotalPile 10 40 50Face 10 40 50Total 20 80 100
• Dans le groupe « pile » il y a 20% de femmes enceintes….
• La probabilité post test est
égale à la probabilité pré test.
• Le jet de la pièce de monnaie n’apporte rien en termes de décision.
Caractéristiques des examens complémentaires
Pour faire le choix entre différents examens, quelles caractéristiques utilise-t-on ? Fiabilité/Reproductibilité Validité de l’examen Dépistage ou Confirmation diagnostique Risques Coût Acceptabilité
Fiabilité/Reproductibilité
La reproductibilité est caractérisée par le fait que deux observateurs auront des jugements concordants.
Plus un examen est reproductible plus il est fiable.
La reproductibilité peut être mesurée par le coefficient de Kappa.
Kappa Soit le tableau des résultats (+ et -) pour 2
réalisations A et B concordance observée = concordance
réelle + concordance aléatoire. La concordance observée est p0 = (a+d)/N La concordance aléatoire est calculée sous
l'hypothèse d'indépendance de A et B a' = n1*N1/N et d' = n2*N2/N sont les effectifs théoriques pc = a’+d’/N
Kappa = (concordance réelle/ concordance non aléatoire)
1. KAPPA =
On admet que la concordance est : bonne si Kappa > 0,6 mauvaise si Kappa < 0,3 intermédiaire entre les deux.
+ -
+ a b N1 = a+b
- c d N2 = c+d
n1 = a+c n2 = b+d N =a+b+c+d
Réalisation 1
Réa
lisa
tion 2
p - pc 1- pc
0
Validité de l’examen
C’est sa capacité à identifier la maladie ou à suivre un traitement
2 types d’examens Examen avec réponse Positif/Négatif
(recherche de BK dans les crachats/tuberculose)
Examen avec réponses quantitatives (glycémie/diabète) => Problème du seuil
Identification de la maladie Examen de référence : gold standard
Validité de l’examen Sensibilité/Spécificité d’un test Courbe de ROC Rapport de vraisemblance Règle de Sackett Prévalence de la maladie Valeurs prédictives positive et
négative Gain diagnostique d’un test
Sensibilité et spécificité
Sensibilité = fréquence des tests positifs chez les malades
Sensibilité = a/n1 = Vrais positifs chez les malades
Spécificité = fréquence des tests négatifs chez les sujets sains
Spécificité = d/n2 = Vrais négatifs chez les non malades
Sensibilité et spécificité sont indépendantes de la prévalence de la maladie
Pour évaluer ces fréquences, il faut un groupe de malades => Gold standard
Efficacité diagnostique = fréquence des biens classés = (a+d)/(a+b+c+d)
Intérêt des études cas/témoins pour sensibilité et spécificité
Attention n1/(n1+n2) ne donne pas nécessairement la prévalence
Malades SainsT+ a (VP) b (FP)T- c (FN) d (VN)
n1=a+c n2=b+d
Test quantitatif avec limite Courbe de ROC Receiver Operating Characteristic
pour la détection des avions ennemis par les radars
Résultat du test quantitatif En fonction de la limite que l’on se
fixe pour dire que le test est positif, on obtient différentes valeurs de sensibilité et de spécificité
Courbe de ROC
Ici si l’on déplace la limite vers la droite, la spécificité va augmenter et le sensibilité va diminuer (diabète et glycémie par exemple)
Attention, il existe des cas inverse : taux d’hormones et hypothyroidie
Glycémie et diabète
Courbe de ROC A chaque valeur de la limite
L du critère quantitatif : valeur de la sensibilité et de la spécificité.
On obtient ainsi 1 point de la courbe.
En faisant varier la limite L on obtient d’autres points.
La courbe joignant les points est la courbe de ROC.
Les valeurs de sensibilité et spécificité en fonction de L peuvent être obtenues par l’observation ou par la modélisation du phénomène par une loi de probabilité.
1
10
Sensibilité
1-Spécificité
Courbe de ROC
Aire sous la courbe : AROC Entre 0,5 (examen au hasard :
pile ou face) et 1 (examen parfait)
Instrument privilégié d’évaluation et de comparaison des performances diagnostiques des examens complémentaires
Indice de Youden et rapport de vraisemblance Le test idéal sensibilité = 1 et spécificité
= 1 n’existe pas Rapports de vraisemblance
RV+ : L =
Un sujet a L fois plus de chance d'avoir le test positif s'il est atteint de la maladie que dans le cas contraire
RV- :
Indice de Youden Y = Se + Sp – 1
Se
1 - Sp
Sp
Se
1
Valeur diagnostique d’un test La valeur diagnostique d'un test est
d'autant plus grande que l'indice de Youden est plus proche de 1.
L'apport diagnostique d'un résultat positif du test est d'autant plus grand que le RV+ (L) est plus élevé.
L'apport diagnostique d'un résultat négatif d'autant plus grand que le RV- est plus petit et proche de zéro.
B.Grenier
Règle de Sackett
Si un test a une spécificité élevée, un résultat positif confirme l’hypothèse diagnostique.
Si un test a une sensibilité élevée, un résultat négatif élimine le diagnostic.
Prévalence de la maladie
C’est la fréquence de la maladie dans la population considérée (pourcentage de cas)
Attention : La prévalence dépend notamment de : La zone géographique (palu en Afrique et en
France) De la sélection de la population
Exercice libéral/hôpital Présélection par un dépistage …
Valeurs prédictives
VPP : probabilité d’avoir la maladie quand le test est positif VPN : probabilité de ne pas avoir la maladie quand le test
est négatif VPP et VPN dépendent de 3 paramètres
Sensibilité Spécificité Prévalence (probabilité pré test)
Attention VPP et VPN se calculent directement sur le tableau à 4 cases que si n1/(n1+n2) représente la prévalence de la maladie
cas si l’étude a été menée sur un échantillon représentatif mais pas dans une étude cas témoins qui aurait été utilisée pour déterminer la sensibilité et la spécificité.
VPP et VPN se calculent dans tous les cas par le théorème de Bayes ou l’arbre des probabilités
Valeurs prédictives
Malades SainsT+ a (VP) b (FP) N1 = a+bT- c (FN) d (VN) N2 = c+d
n1=a+c n2=b+d N = a+b+c+d
Si l’étude est faite sur un échantillon représentatif, n1/N est la prévalence de la maladie.
On peut calculer Se et Sp Se =a/n1 = VP/(VP+FN) Sp = d/n2 = VN/(FP+VN)
Dans ce cas particulier, on peut calculer directement à partir du tableau les VP
VPP = a/N1 = VP/(VP+FP) VPN = d/N2 = VN/(VN+FN)
• VP : Vrai Positifs• VN : Vrai Négatifs• FP : Faux Positifs• FN : Faux Négatifs
• N1 : Tests positifs• N2 : Test négatifs• n1 : Malades• n2 : Non malades
Valeurs prédictives Théorème de Bayes
Test Négatif
Malade
Non Malade
Prévalence
1 - Prévalence
Test Positif
Test Positif
Test Négatif
Sensibilité
1 - Sensibilité
1 - Spécificité
Spécificité
)1(*)1()*(
*
éspécificitprévalencesensibiltéprévalence
ésensibilitprévalenceVPP
)1(*)()(*)1(
)(*)1(
sensibiltéprévalenceéspécificitprévalence
éspécificitprévalenceVPN
VPP, VPN et prévalence
0,00
0,10
0,20
0,30
0,40
0,50
0,60
0,70
0,80
0,90
1,00
0,00 0,10 0,20 0,30 0,40 0,50 0,60 0,70 0,80 0,90 1,00
Prévalence
VPP
VPN
Pour une sensibilité donnée, VPP et VPN varient en fonction de la prévalence.
VPP, VPN et la prévalence
Prévalence du paludisme 90% en Afrique 0,001 (1 pour mille) en
France. Un test biologique est
utilisé pour le diagnostic avec une sensibilité de 95% et une spécificité de 85%.
=> L = 6,3 =0,05
Quelles seront les probabilités pour des patients africains et français d’avoir le paludisme quand le test est positif et inversement de ne pas avoir la maladie quand le test est négatif ?
9999,0))95,01(*001,0(85,0*)001,01(
85,0*)001,01(
654,0))95,01(*9,0(85,0*)9,01(
85,0*)9,01(
006,0)85,01(*)001,01(95,0*001,0
95,0*001,0
983,0)85,01(*)9,01(95,0*9,0
95,0*9,0
VPNFrance
AfriqueVPN
VPPFrance
VPPAfrique
Pour un test donné, quand la prévalence augmente, la VPP augmente et la VPN diminue
Influence de la succession de tests
Dans la population générale la prévalence de la maladie est de 10%.
Le généraliste utilise un test avec une sensibilité de 90% et une spécificité de 95%.
Il envoie tous les sujets positifs à l’hôpital où l’on refait le même test.
Chez le généraliste
MaladeNon maladeTotal
Test + 90 45 135
Test - 10 855 865
Total 100 900 1000
Prévalence = 0,1Sensibilité = 0,9Spécificité = 0,95
VPP = 0,67VPN = 0,99
Le généraliste adresse les sujets test + à l’hôpital. Dans ce groupe la prévalence est de 90/135 = 0,67 c’est la VPP du test chez le généraliste….
A l’hôpital
Le test à toujours la même sensibilité et la même spécificité mais la prévalence dans le groupe sélectionné passe de 0,10 à 0,67
VPP à l’hôpital = 0,97 VPN à l’hôpital = 0,82
MaladeNon malade Total
Test + 603 17 620
Test - 67 314 381
Total 670 330 1000
Quand le test est positif, on passe d’un peu plus d’une chance sur deux que le sujet soit malade (chez le généraliste) à une quasi certitude (à l’hôpital) chez les sujets sélectionnés….
Diagramme de Fagan permet sans calcul de déterminer la probabilité post-test à partir de la prévalence (probabilité pré-test) et du rapport de vraisemblance
Gain diagnostique d’un test
Gain diagnostique positif C’est la différence entre la probabilité pré-
test (prévalence) de la maladie et la probabilité post-test (valeur prédictive positive)
Gain positif = VPP – prévalence
Dépistage, confirmation diagnostique
Dépistage : S’adresse à des sujets ne se plaignant de rien à
priori sains Prendre un test à sensibilité élevée (peu de FN
et VPN élevé) Éventuellement suivi d’un test de confirmation Ne pas oublier les autres éléments
Acceptabilité, Risque, Coût Confirmation d’une maladie suspectée
Prendre un test avec une spécificité élevée (peu de FP, VVP élevée) d’autant plus que le coût du faux positif est élevé
Risques Risque que le résultat du test ne reflète pas la
réalité : Affirmer une maladie à la vue d’un résultat positif du
test : VPP => Risque de se tromper 1-VPP Rejeter une maladie à la vue d’un résultat négatif du
test : VPN => Risque de se tromper 1-VPN Se méfier de la répétition des examens :
Au-delà de trois répétitions, le risque d’être faux positif augmente :
La spécificité de l’examen diminue fortement Risque de iatrogénie
De l’examen lui-même De l’examen de confirmation Du à la répétition des examens
Type d’étude pour évaluer sensibilité, spécificité, VPP, VPN d’un test
Etude comparative avec « étalon or » Pour évaluer la sensibilité et la spécificité on
doit disposer d’un groupe de malades et d’un groupe de non malades ce qui nécessite une méthode de référence « étalon or » pour décider qu’un sujet est malade ou non malade
L’étalon or peut être un autre test, l’évolution clinique du malade,…..
Tous les sujets auront l’étalon or et le nouveau test
Type d’étude pour évaluer sensibilité, spécificité, VPP, VPN d’un test
Etude sur un échantillon représentatif de la population : Avantage : le tableau à 4 cases
permettra directement de déterminer toutes las caractéristiques
Inconvénient : la prévalence de la maladie étant en général faible, la précision de la sensibilité sera faible par contre celle de la spécificité sera élevée. La précision de la VPP et de la VPN seront faibles
Rappel sur la précision d’un pourcentage
Exemple
Dans le cadre de l’évaluation de trousses de dépistage du VIH, on a tiré au sort 1000 sujets dans une population gabonaise. Il s’agit d’évaluer la trousse de dépistage rapide CORE HIV1&2 réalisé sur place. L’examen de référence a été réalisé au CHU de Rouen (western blot).
Exemple
Western blot +
Western blot -
Total
Core HIV1&2 + 71 27 97Core HIV1&2 - 9 893 903Total 80 9201000
La prévalence dans cette étude est de :
Prév. = 80/1000 = 0,08La vraie valeur de la prévalence a 95 chances sur 100 d’être comprise entre 0,063 et 0,097
La sensibilité est deSens = 71/80 = 0,88
La vraie valeur de la sensibilité a 95 chances sur 100 d’être comprise entre 0,81 et 0,95
La spécificité est deSpé = 893/920 = 0,97
La vraie valeur de la spécificité a 95 chances sur 100 d’être comprise entre 0,96 et 0,98
VPP = 0,73 IC 0,64 – 0,81VPN = 0,99 IC 0,98 – 1
Exemple Dans le cadre de l’évaluation de
trousses de dépistage du VIH, réalise une étude cas/témoins 500 sujets positifs au WB et 500 négatifs dans une population gabonaise. Il s’agit d’évaluer la trousse de dépistage rapide CORE HIV1&2. L’examen de référence a été réalisé au CHU de Rouen (WB : western blot).
ExempleWestern blot +
Western blot - Total
Core HIV1&2 + 441 15 456Core HIV1&2 - 59 486 545Total 500 500 1000
Dans cette étude (Cas/témoin),
• on ne peut pas estimer la prévalence
• On ne peut pas à partir du tableau calculer les VPP et VPN
La sensibilité est de :Sens = 441/500 =
0,88IC 0,85 - 0,91
La spécificité est de :Spé = 486/500 =
0,97IC 0,96 – 0,99
Pour le coût on a nettement amélioré la précision de la sensibilité sans détériorer de manière importante celle de la spécificité.
Les VPP et VPN seront calculée avec le théorème de Bayes
Coût de l’examen
A distinguer : Coûts directs de l’examen Coûts indirects : arrêt de travail, perte de
production… Indicateur
Efficience = Coût / Efficacité Effectivité = Coût / Efficacité en situation
réelle
Acceptabilité des examens Obligation de l’information du patient des bénéfices
risques attendus de l’examen Obligation légale réaffirmée par la loi du 4 mars 2002 (Loi
Kouchner) Obligation de se conformer au choix du patient
C’est le patient qui fait le choix, le médecin est là pour éclairer sa décision en prenant en
compte la nature de l’examen, le coût, la gravité de la maladie potentielle, les conditions socio-culturelles, les facteurs moraux et éthiques pour adapter sa communication.
SI le patient a donné son accord mais ne veut pas connaître le résultat :
Respecter son choix sauf si maladie transmissible pouvant nuire à un tiers
Analyse critique d’un compte rendu d’examen Dépend de la nature de l’examen
Biologie Test positif ou Négatif Valeur quantitative à comparer à des bornes (problème de l’être
normal) Imagerie, anatomopathologie
Description des lésions Interprétation diagnostique
La malignité d’une lésion est jusqu’alors un diagnostic anatomopathologique. Épreuves fonctionnelles
Cinétique des événements Un CR doit comporter
L’identification du patient (nom, prénom, date de naissance, sexe) La date de l’examen (date de prélèvement si nécessaire) et date
du résultat La finalité de l’examen (objectifs attendus) et le contexte clinique
de réalisation La nature de l’examen et les méthodes utilisées Le résultat Nom du médecin ayant réalisé, validé, interprété l’examen
Prendre en compte les référentiels médicaux
Les 5 niveaux de preuve de l’EBM et les 4 grades de l’HAS
Référentiels médicaux Guides de bonnes pratiques cliniques Références médicales opposables Rôles de l’HAS
Les 5 niveaux de preuves (Attention c’est l’EBM) Les 5 niveaux de preuve de la médecine basée
sur les preuves (Evidence Based Medicine) Niveau 1 (le plus élevé)
Revue systématique d’essais randomisés : méta-analyse Niveau 2
Au moins un essai randomisé Niveau 3
Pas d’essai randomisé, étude de cohorte, étude cas témoins…
Niveau 4 Étude d’observation dans plusieurs groupes indépendants
Niveau 5 (le plus faible) Opinions d’experts, opinions d’autorités reconnues
Les 4 grades de l’ANAESC’est la référence en France) Grade A (le plus élevé)
Essais randomisés puissants de qualité, méta-analyse
Grade B Essais randomisés de faible puissance,
essais comparatifs non randomisés, étude de cohorte
Grade C Cas/témoins, études de séries de cas
Grade D Accord professionnel
Rédiger une demande d’examen complémentaire et établir une collaboration avec un collègue
Les éléments de la demande Identification du prescripteur, Identification du patient Nature de l’examen demandé Objectif de la demande et stratégie envisagée Éléments cliniques du dossier pertinents pour
la continuité de la prise en charge et le bon déroulement de l’examen (allergie, condition particulière, affections suspectées…)
Urgence de la demande Identification du ou des destinataires des
résultats
Analyse d’article Questions à se poser :
Le test étudié est-il comparé à un test de référence (gold standard) ? Le test de référence est il correctement décrit ? Le test de référence est-il validé (qualité du test, choix du seuil en cas de mesure quantitative…) ?
L’étude est-elle correctement menée ? Le lieu de l’étude et la méthodologie (cas/témoins, cohorte, essai randomisé, étude médico-économique) sont-ils décrits ? Le test de référence est-il pratiqué chez tous les patients (malades et non malades) ? Sinon quelle est la méthode d’échantillonnage ? Le test de référence et le test étudié sont-ils interprétés indépendamment ?
Les échantillons de malades et de non malades sont-ils représentatifs de la population à la quelle le test doit être appliquée ?
Quels sont les biais relevés ? Quels sont les autres biais ? Les biais identifiés ont-ils été contrôlés ? Les biais invalident-ils l’étude ?
Les performances du test sont-elles fournies ? Reproductibilité Sensibilité, spécificité Rapports de vraisemblance Probabilité pré-test, post-test
Quelle est la précision des indicateurs Nombre de sujets, intervalle de confiance…
Si il y a comparaison statistiques Les risques alpha et bêta sont ils précisés ? Le test statistique utilisé est il pertinent ?
Les résultats sont –ils cohérents avec les connaissances actuelles ? Niveau de preuve ?
Les résultats s’appliquent-ils à mon patient ? Lieu de l’étude Bénéfices/Risques Coûts/ Bénéfices
L’étude a –t-elle respectée la réglementation et les principes éthiques ? CPPRB, Loi informatique et liberté…
Quel est l’impact de l’étude sur la santé ?
Exemple 1 Madame B., mariée, secrétaire d’une PME, a
eu une conduite à risque vis-à-vis du VIH. Question 1 : Elle se rend au centre de
dépistage anonyme et gratuit. Quelles doivent être les caractéristiques du test de dépistage employé ?
Question 2 : 3 jours après, Mme B revient consulter. Ayant reçu les résultats, vous savez qu’elle est séropositive. Elle vous indique qu’elle est revenue par politesse mais ne veut pas connaître le résultat. Que faites-vous ?
Exemple1 Question 1 : Elle se rend au centre de dépistage
anonyme et gratuit. Quelles doivent être les caractéristiques du test de dépistage employé ? /12
Sensibilité élevé/4. Privilégier la sensibilité sur la spécificité/2. Faible coût/2. Acceptabilité/2. Faible risque/2.
Question 2 : 3 jours après, Mme B revient consulter. Ayant reçu les résultats, vous savez qu’elle est séropositive. Elle vous indique qu’elle est revenue par politesse mais ne veut pas connaître le résultat. Que faites-vous ?/12
Expliquer à Mme B la conduite de confirmation diagnostique/3 Spécificité élevé du test de confirmation diagnostique/1, Obligation d’information de la patiente maladie contagieuse/1
transmissible/1 exposant un tiers/1 art 111-2 loi du 4 mars/2, Convaincre Mme B d’adopter une conduite adaptée à son risque de
transmission du VIH/4.