Initiation à la logique Bayésienne

Preview:

DESCRIPTION

Initiation à la logique Bayésienne - Conférence de la 5e édition du Cours international « Atelier Paludisme » - Frédérick GAY - CHU Pitie-Salpetriere, Paris - fredogay@yahoo.fr

Citation preview

Initiation à la logique Bayésienne

Département des Maladies Infectieuses et Tropicales

GHU Pierre et Marie Curie

Site Pitié-Salpêtrière

Mercredi 28 mars 2007

Dr. Frédérick Gay

Université Pierre et Marie Curie – Paris 6

Au quotidien…

• Film photographique

• Détecteur de sécurité

• Filet de pêche

• Arme à feu

• Profil de poste

• Définition d’un cas

5- Comprendre le lien entre le théorème de Bayes et

la signification statistique

Objectifs :

1- Comprendre et savoir estimer les paramètres

de validité intrinsèque

2- Comprendre et savoir estimer les paramètres

de validité prédictive

3- Savoir ce que sont les probabilités a priori et a

posteriori et les rapports de vraisemblance

4- Savoir discuter et choisir les meilleures stratégies

en fonction des objectifs recherchés

Vocabulaire et applications

• Validité = Performance = Valeur diagnostique = Evaluation

• Test / Signe / Symptôme / Examen complémentaire / Combinaison de signes / Système d’alerte…

Validité intrinsèque

• Un test réagit-il correctement

à la présence ou à l’absence

d’une maladie ?

Validité “a priori”

• Paramètres intrinsèques :

– Référence / procédé conventionnel /

Test standard (“Gold Standard”)

– Sensibilité

– Spécificité

– Rapport de vraisemblance positif

– Rapport de vraisemblance négatif

Sensibilité :

Définitions de la Sensibilité :

� Capacité du test de donner un résultat positifquand la maladie est présente

� Probabilité conditionnelle que le test soit positiflorsque la maladie est présente

� Estimée par la proportion de résultats positifslorsque le test est appliqué à des malades

� Estimée par la proportion de malades dont le résultat du test est positif

� La sensibilité mesure à quel point le test estcapable d’identifier les malades

Spécificité :

Définitions de la Spécificité :

� Capacité du test de donner un résultat négatifquand la maladie est absente

� Probabilité conditionnelle que le test soit négatiflorsque la maladie est absente

� Estimée par la proportion de résultats négatifslorsque le test est appliqué à des non-malades

� Estimée par la proportion de non malades dont le résultat du test est négatif

� La spécificité mesure à quel point le test estcapable d’exclure les non malades

Sensibilité : Spécificité :

Fusion artificielle de 2 tableaux indépendants :

Double diffusion

Pas d’arc

Absence d’argument

Immunologique en faveur

de maladie du poumon de

fermier

Présence d’arcs

Maladie du poumon

de fermier

SEROLOGIE DE LA MALADIEDU POUMON DE FERMIER

Choix du seuil :

Choix du seuil :

0 50 100

100

50

0

Se

nsib

ilité

(%

)

%age de faux positifs

Courbe ROC :

SEROLOGIE DE LA TRICHINOSE

IF

Absence d’argument immunologique en

faveur d’unetrichinose

Code 0

1er examen

2eme examen

Trichinose immunologique

Code 1Code 200

Code 401

- 200 400 ≥400

Si 1er 400 : Code 402Si 1er <400: Code 403Si 1er >400: Code 404

Indices de synthèse

J = Se + Sp – 1

� Varie de -1 à +1

� J= 0 signifie que le test n’appporte aucune orientation diagnostique

� Indice peu utilisé

Indice de Youden (J) :

Objectifs :

1- Comprendre et savoir estimer les paramètres

de validité intrinsèque

2- Comprendre et savoir estimer les paramètres

de validité prédictive

Validité prédictive

Validité prédictive

• Un test est-il un bon indicateur de la présence ou non de la maladie ?

• Aptitude d’un test à reconnaître les malades et les non-malades

• Le résultat positif (ou négatif) d’un test correspond-il à une probabilité élevéed’être affecté (ou non) par la maladie ?

Validité “a posteriori”

• Paramètres extrinsèques :

– Valeur prédictive positive

– Valeur prédictive négative

– Rôle du taux de prévalence

– Effet de la sensibilité

– Effet de la spécificité

Définitions de la valeur prédictive positive

d’un test positif (VPP) :

� La VPP d’un test positif mesure la probabilitéconditionnelle que la maladie soit présente si le test est positif

� La VPP est estimée par la proportion de maladeschez les positifs au test

Définitions de la valeur prédictive négative

d’un test négatif (VPN) :

� La VPN d’un test négatif mesure la probabilitéconditionnelle que la maladie soit absente sile test est négatif

� La VPN est estimée par la proportion de sujets sains chez les négatifs au test

Etude transversale en population :

Etude transversale en population :

Calcul empirique par simulation :

Formule de Bayes :

Théorème de Bayes :

P(B/A)=P(B) x P(A/B)

P(A)

P(B/A)=P(B) x P(A/B)

[P(B) x P(A/B)] + [P(B)x P(A/B)]

VPP d’un test positif :

VPN d’un test négatif :

VPN =

VPP =

VPP d’un test positif :

VPN d’un test négatif :

VPN =Sp x (1 - Pr)

[Sp x (1 - Pr)] + [(1 - Se)x Pr]

VPP =Se x Pr

(Se x Pr) + [(1 - Sp) x (1 – Pr)]

Exercice :

���� Vos conclusions ?

� Santé publique 10%

� Soins généraux 50%

� Service spécialisé 90%

Tx de Pr VPP VPN

� Sensibilité = 90%

� Spécificité = 80%

33,3% 98,6%

81,2% 88,9%

97,6% 47,1%

0 50 100

100

50

0

Taux de prévalence (%)

%

Va

leu

rs p

réd

ictive

s

Exactitude / Efficience (E) :

VP FP

VNFN

M+ M-

+

-

Test

% de bien classés =

Indices de synthèse

Objectifs :

1- Comprendre et savoir estimer les paramètres

de validité intrinsèque

2- Comprendre et savoir estimer les paramètres

de validité prédictive

3- Savoir ce que sont les probabilités a priori et a

posteriori et les rapports de vraisemblance

Probabilité a priori :

� Probabilité d’existence de la maladie avant le résultat du test

� Fonction du contexte clinique et épidémiologique du sujet

���� Probabilité pré-test

Probabilité a posteriori :

� Représente la situation après le test

� Un test positif augmente la probabilitéd’existence de la maladie, un test négatif la diminue

���� Probabilité post-test

Vraisemblance exprimée en termes de

probabilité ou de cote :

� La probabilité qu’un évènement se réalise est la proportion de fois où l’on s’attend à voir cetévènement se réaliser au cours de plusieursessais ���� [ 0 ; 1 ]

� La cote est définie comme la probabilité quel’évènement se produise divisée par la probabilité

que l’évènement ne se produise pas ���� [ 0 ; ∞ ]

Conversions :

Cote =Probabilité

1- Probabilité

Probabilité =Cote

1+ Cote

Rapport de vraisemblance positif(positive likelihood ratio: LR+)

� Quantité par laquelle il faut multiplier la cote pré-test pour obtenir la cote post-test

� Concernant les sujets pour lesquels le résultat du test est positif

LR+ =Cote post-test

Cote pré-test

Rapport de vraisemblance positif :

Rapport de vraisemblance positif :

VP FP

VNFN

M+ M-

+

-

Test

Rapport de vraisemblance positif

=Se

1 - Sp

Rapport de vraisemblance positif(positive likelihood ratio: LR+)

� Quantité par laquelle il faut multiplier la cote pré-test pour obtenir la cote post-test

� Concernant les sujets pour lesquels le résultat du test est positif

LR+ =Cote post-test

Cote pré-test=

Sensibilité

1 - Spécificité

Rapport de vraisemblance négatif(negative likelihood ratio: LR-)

� Quantité par laquelle il faut multiplier la cote pré-test pour obtenir la cote post-test

� Lorsque le résultat du test est négatif

LR- =Cote post-test

Cote pré-test

Rapport de vraisemblance négatif :

Rapport de vraisemblance négatif :

VP FP

VNFN

M+ M-

+

-

Test

Rapport de vraisemblance négatif

=1 - Se

Sp

Rapport de vraisemblance négatif(negative likelihood ratio: LR-)

� Quantité par laquelle il faut multiplier la cote pré-test pour obtenir la cote post-test

� Lorsque le résultat du test est négatif

LR- =Cote post-test

Cote pré-test=

1 - Sensibilité

Spécificité

Objectifs :

1- Comprendre et savoir estimer les paramètres

de validité intrinsèque

2- Comprendre et savoir estimer les paramètres

de validité prédictive

3- Savoir ce que sont les probabilités a priori et a

posteriori et les rapports de vraisemblance

4- Savoir discuter et choisir les meilleures stratégies

en fonction des objectifs recherchés

Test BTest A

A – & B –A + & B –A - & B +A + & B +

ou

- +- +

Tests en parallèle :

Exercice (2 tests en parallèle) :

Condition d’indépendance entre les tests !

� TA

� TB

� TATB

VPP VPN

� Test A (TA) : Se = 90% ; Sp = 80%

� Test B (TB) : Se = 70% ; Sp = 60%

� Taux de Prévalence (Pr) = 10%

VPP de 2 tests positifs effectués en parallèle :

VPP =

Pr x (SeTA) x (SeTB)

[Pr x (SeTA) x (SeTB)] + [(1-Pr) x (1-SpTA) x (1-SpTB)]

VPN de 2 tests négatifs effectués en parallèle :

VPN =

(1-Pr) x (SpTA) x (SpTB)

[(1-Pr) x (SpTA) x (SpTB)] + [Pr x (1-SeTA) x (1-SeTB)]

Exercice (2 tests en parallèle) :

Condition d’indépendance entre les tests !

� TA 33,3 98,6

� TB 16,3 94,7

� TATB 46,7 99,3

VPP (%) VPN (%)

� Test A (TA) : Se = 90% ; Sp = 80%

� Test B (TB) : Se = 70% ; Sp = 60%

� Taux de Prévalence (Pr) = 10%

Deux tests en parallèle :

� Lorsque les 2 tests sont positifs :

VPP améliorée

� Lorsque les 2 tests sont négatifs :

VPN améliorée

���� Applicable à n tests…

Test B

Test A

Tests en série :

ou

Test B

- +

- +

- +

A + puis

B +

A –puis

B –

A –puis

B +

A + puis

B -

Exercice (2 tests en série) :

� TA

� TB siTA+

� TB siTA-

VPP (%) VPN (%)

� Test A (TA) : Se = 90% ; Sp = 80%

� Test B (TB) : Se = 70% ; Sp = 60%

� Taux de Prévalence (Pr) = 10%

Exercice (2 tests en série) :

Le test A modifie la probabilité pré-test B

� TA 33,3 98,6

� TB siTA+ 47

� TB siTA- 99,3

VPP (%) VPN (%)

� Test A (TA) : Se = 90% ; Sp = 80%

� Test B (TB) : Se = 70% ; Sp = 60%

� Taux de Prévalence (Pr) = 10%

Absence d’argument immunologique en faveur

d’une cysticercose

Taux limite d’anticorps nepermettant pas d’affirmer

une cysticercose

0-10 u > ou = 35 u10 u < Titre < 35 u

Western Blot

Présence d’anticorps enELISA dont la spécificité

n’est pas confirmée

CYSTICERCOSEIMMUNOLOGIQUE

Négatif Positif

ELISA

SEROLOGIE DE LA CYSTICERCOSE

INTERPRETATION

SEROLOGIE DISTOMATOSE

HG ES

IEP≤320 >320

- +

Absence d’argument immunologique en

faveur d’unedistomatose

Code 0Taux moyen

d’anticorps enhémagglutination

non confirmés en ES

Code dh

+ -

Absence d’argument immunologique en

faveur d’unedistomatose

Code 0

Distomatoseimmunologique

Code 1

Absence d’argument

Immunologique en

Faveur de

Larva migrans

SEROLOGIE DE TOXOCAROSE

Résultats sérologiques

en faveur d'une

Larva migrans

viscérale

Anticorps en ELISA

non confirmés en ES et en

WB. Possibilité de Larva migrans

viscérale ancienne ou d'une réaction

croisée avec une autre nématodose.

ELISA ES

>50 ≤50 +-

WB

+ -

IEP

- +

Résultats sérologiques

en faveur d'une

Larva migrans

viscérale

Code wb+

Code 0

Code wb-

SEROLOGIE HYDATIDOSE

ELISA ES

+ (arc 5)-

Hydatidoseimmunologique

<50

HG

≥75

≥640

Absence d’argument immunologique en

faveur d’unehydatidose

Code 0

Hydatidoseimmunologique

Code 1

50≤ <75

HG

≤320 ≥640

Taux d’Ac en ELISAdont la spécificitéhydatique ne peut

Être affirmée.

Code 1Code de

WBDemande du

biologiste si

forte suspicion

Diagnostic versus Dépistage

Diagnostic Dépistage

� Milieu clinique : Pr forte

� Nbre de FP faible

� Pb des FP ++

� ↑ Sp ↓ FP

� Pr faible

� Nbre de FP ++

� donc ↑ spécificité

� Groupes à risque

� Second test

Analyse décisionnelle

1. Validité intrinsèque

2. Validité pédictive

3. “Fréquence” de la maladie

4. Gravité de la maladie

5. Efficacité du traitement

6. Risques du traitement

7. Coûts (humain et financier) du test

8. “Coûts” (humain et financier) du traitement

9. Objectif du test : dépistage ou diagnostic ?

5- Comprendre le lien entre le théorème de Bayes et

la signification statistique

Objectifs :

1- Comprendre et savoir estimer les paramètres

de validité intrinsèque

2- Comprendre et savoir estimer les paramètres

de validité prédictive

3- Savoir ce que sont les probabilités a priori et a

posteriori et les rapports de vraisemblance

4- Savoir discuter et choisir les meilleures stratégies

en fonction des objectifs recherchés

Choix du seuil d’un test diagnostique :

VP FP

VNFN

M+ M-

+

-

Test

Trouver un compromis entre les FP et les FN

Bayes et p-value

Choix du seuil α d’un test statistique :

Pas d’erreurErreur

de type I

S

NS

Test

Trouver un compromis entre α et β

Bayes et p-value

Populations

=

Pas d’erreurErreur de

type II

Bayes et p-value

� Si le test de laboratoire mesure la concentration

d’une substance, celle-ci doit être considérée tellequelle sans se préoccuper des FP et des FN

���� (il n’y pas de résultat négatif ou positif)

� Si la p-value est un moyen de décrire ou de résumer les données, nul besoin de se préoccuper des erreurs de type I et II ���� (le résultat n’est ni significatif ni non-significatif)

Spécificité et risque α

� Test diagnostique : Si le patient n’est pas malade, la probabilité que le test donne un résultat positif

= 1- Sp

� Test statistique : Si les 2 populations ont les

mêmes moyennes (ou %ions), la probabilité quel’étude mette en évidence une différencestatistiquement significative

= α

Sensibilité et risque β

� Test diagnostique : Si le patient est malade, la probabilité que le test donne un résultat positif

= Se

� Test statistique : S’il existe une différence ∆ entre

les moyennes (ou %ions) des 2 populations, la probabilité que l’étude mette en évidence unedifférence statistiquement significative

= 1- β

Question posée :

� Dans quelle proportion de l’ensemble des étudesqui donnent de p-values significativesl’hypothèse nulle est-elle vraie ?

� Si un résultat est statistiquement significatif, quelle est la probabilité que l’hypothèse nullesoit vraie ?

Exemple :

Quelle est la probabilité de chacune de ces possibilités ?

� Un nouveau médicament génère une baisse significativede la moyenne de la PA : 2 possibilités

� Ce médicament est réellement anti-HTA

� Ce médicament n’est pas anti-HTA, le résultat est le fait du hasard

� Etude de médicaments potentiellement anti-HTA

� ∆ = 10 mmHg

� Effectifs offrant une puissance = 80%

� Risque α = 0,05

Médicament A :

���� 64% de chance qu’il soit réellement efficace

� ≠ significative 80 45 125

� ≠ non significative 20 855 875

� Total 100 900 1000

efficace inefficace Total

� Appartient à une famille instable, faible affinité, etc.

� Probabilité a priori = 10%

Médicament B :

���� 98,5% de chance qu’il soit réellement efficace

� ≠ significative 640 10 650

� ≠ non significative 160 190 350

� Total 800 200 1000

efficace inefficace Total

� Bonne affinité, stable, bloque les bons récepteurs

� Probabilité a priori = 80%

Médicament C :

���� 14% de chance qu’il soit réellement efficace

� ≠ significative 8 50 58

� ≠ non significative 2 940 942

� Total 10 990 1000

efficace inefficace Total

� Sélectionné au hasard dans une banque de produits

� Probabilité a priori = 1%

� Résultat

� Objectif

� Erreurs

� Seuil

� Précision

� Interprétation

� Comparaisons

multiples

Test diagnostique Test statistique

+ / - S / NS

M ou ךM H0 ou H1

FN & FP α & β

Compromis entre Compromis entre

% de bien classés Puissance

VPP ou VPN Probabilité

Tests Correction

FN et FP α et β

en série de Bonferoni

que la ≠ soit vraie

Objectifs atteints ? :

1- Comprendre et savoir estimer les paramètres

de validité intrinsèque

1- Comprendre et savoir estimer les paramètres

de validité intrinsèque

2- Comprendre et savoir estimer les paramètres

de validité prédictive

2- Comprendre et savoir estimer les paramètres

de validité prédictive

3- Savoir ce que sont les probabilités a priori et a

posteriori et les rapports de vraisemblance

3- Savoir ce que sont les probabilités a priori et a

posteriori et les rapports de vraisemblance

4- Savoir discuter et choisir les meilleures stratégies

en fonction des objectifs recherchés

4- Savoir discuter et choisir les meilleures stratégies

en fonction des objectifs recherchés

5- Comprendre le lien entre le théorème de Bayes et

la signification statistique

5- Comprendre le lien entre le théorème de Bayes et

la signification statistique

Recommended