Initiation à la logique Bayésienne

Département des Maladies Infectieuses et Tropicales

GHU Pierre et Marie Curie

Site Pitié-Salpêtrière

Mercredi 28 mars 2007

Dr. Frédérick Gay

Université Pierre et Marie Curie – Paris 6

Au quotidien…

• Film photographique

• Détecteur de sécurité

• Filet de pêche

• Arme à feu

• Profil de poste

• Définition d’un cas

5- Comprendre le lien entre le théorème de Bayes et

la signification statistique

Objectifs :

1- Comprendre et savoir estimer les paramètres

de validité intrinsèque

de validité prédictive

3- Savoir ce que sont les probabilités a priori et a

posteriori et les rapports de vraisemblance

4- Savoir discuter et choisir les meilleures stratégies

en fonction des objectifs recherchés

Vocabulaire et applications

• Validité = Performance = Valeur diagnostique = Evaluation

• Test / Signe / Symptôme / Examen complémentaire / Combinaison de signes / Système d’alerte…

Validité intrinsèque

• Un test réagit-il correctement

à la présence ou à l’absence

d’une maladie ?

Validité “a priori”

• Paramètres intrinsèques :

– Référence / procédé conventionnel /

Test standard (“Gold Standard”)

– Sensibilité

– Spécificité

– Rapport de vraisemblance positif

– Rapport de vraisemblance négatif

Sensibilité :

Définitions de la Sensibilité :

� Capacité du test de donner un résultat positifquand la maladie est présente

� Probabilité conditionnelle que le test soit positiflorsque la maladie est présente

� Estimée par la proportion de résultats positifslorsque le test est appliqué à des malades

� Estimée par la proportion de malades dont le résultat du test est positif

� La sensibilité mesure à quel point le test estcapable d’identifier les malades

Spécificité :

Définitions de la Spécificité :

� Capacité du test de donner un résultat négatifquand la maladie est absente

� Probabilité conditionnelle que le test soit négatiflorsque la maladie est absente

� Estimée par la proportion de résultats négatifslorsque le test est appliqué à des non-malades

� Estimée par la proportion de non malades dont le résultat du test est négatif

� La spécificité mesure à quel point le test estcapable d’exclure les non malades

Sensibilité : Spécificité :

Fusion artificielle de 2 tableaux indépendants :

Double diffusion

Pas d’arc

Absence d’argument

Immunologique en faveur

de maladie du poumon de

fermier

Présence d’arcs

Maladie du poumon

de fermier

SEROLOGIE DE LA MALADIEDU POUMON DE FERMIER

Choix du seuil :

0 50 100

ilité

%age de faux positifs

Courbe ROC :

SEROLOGIE DE LA TRICHINOSE

Absence d’argument immunologique en

faveur d’unetrichinose

Code 0

1er examen

2eme examen

Trichinose immunologique

Code 1Code 200

Code 401

- 200 400 ≥400

Si 1er 400 : Code 402Si 1er <400: Code 403Si 1er >400: Code 404

Indices de synthèse

J = Se + Sp – 1

� Varie de -1 à +1

� J= 0 signifie que le test n’appporte aucune orientation diagnostique

� Indice peu utilisé

Indice de Youden (J) :

Objectifs :

Validité prédictive

• Un test est-il un bon indicateur de la présence ou non de la maladie ?

• Aptitude d’un test à reconnaître les malades et les non-malades

• Le résultat positif (ou négatif) d’un test correspond-il à une probabilité élevéed’être affecté (ou non) par la maladie ?

Validité “a posteriori”

• Paramètres extrinsèques :

– Valeur prédictive positive

– Valeur prédictive négative

– Rôle du taux de prévalence

– Effet de la sensibilité

– Effet de la spécificité

Définitions de la valeur prédictive positive

d’un test positif (VPP) :

� La VPP d’un test positif mesure la probabilitéconditionnelle que la maladie soit présente si le test est positif

� La VPP est estimée par la proportion de maladeschez les positifs au test

Définitions de la valeur prédictive négative

d’un test négatif (VPN) :

� La VPN d’un test négatif mesure la probabilitéconditionnelle que la maladie soit absente sile test est négatif

� La VPN est estimée par la proportion de sujets sains chez les négatifs au test

Etude transversale en population :

Calcul empirique par simulation :

Formule de Bayes :

Théorème de Bayes :

P(B/A)=P(B) x P(A/B)

[P(B) x P(A/B)] + [P(B)x P(A/B)]

VPP d’un test positif :

VPN d’un test négatif :

VPP d’un test positif :

VPN d’un test négatif :

VPN =Sp x (1 - Pr)

[Sp x (1 - Pr)] + [(1 - Se)x Pr]

VPP =Se x Pr

(Se x Pr) + [(1 - Sp) x (1 – Pr)]

Exercice :

�� Vos conclusions ?

� Santé publique 10%

� Soins généraux 50%

� Service spécialisé 90%

Tx de Pr VPP VPN

� Sensibilité = 90%

� Spécificité = 80%

33,3% 98,6%

81,2% 88,9%

97,6% 47,1%

0 50 100

Taux de prévalence (%)

ictive

Exactitude / Efficience (E) :

% de bien classés =

Indices de synthèse

Objectifs :

Probabilité a priori :

� Probabilité d’existence de la maladie avant le résultat du test

� Fonction du contexte clinique et épidémiologique du sujet

�� Probabilité pré-test

Probabilité a posteriori :

� Représente la situation après le test

� Un test positif augmente la probabilitéd’existence de la maladie, un test négatif la diminue

�� Probabilité post-test

Vraisemblance exprimée en termes de

probabilité ou de cote :

� La probabilité qu’un évènement se réalise est la proportion de fois où l’on s’attend à voir cetévènement se réaliser au cours de plusieursessais �� [ 0 ; 1 ]

� La cote est définie comme la probabilité quel’évènement se produise divisée par la probabilité

que l’évènement ne se produise pas �� [ 0 ; ∞ ]

Conversions :

Cote =Probabilité

1- Probabilité

Probabilité =Cote

1+ Cote

Rapport de vraisemblance positif(positive likelihood ratio: LR+)

� Quantité par laquelle il faut multiplier la cote pré-test pour obtenir la cote post-test

� Concernant les sujets pour lesquels le résultat du test est positif

LR+ =Cote post-test

Cote pré-test

Rapport de vraisemblance positif :

Rapport de vraisemblance positif

1 - Sp

Rapport de vraisemblance positif(positive likelihood ratio: LR+)

� Concernant les sujets pour lesquels le résultat du test est positif

LR+ =Cote post-test

Cote pré-test=

Sensibilité

1 - Spécificité

Rapport de vraisemblance négatif(negative likelihood ratio: LR-)

� Lorsque le résultat du test est négatif

LR- =Cote post-test

Cote pré-test

Rapport de vraisemblance négatif :

Rapport de vraisemblance négatif

=1 - Se

Rapport de vraisemblance négatif(negative likelihood ratio: LR-)

� Lorsque le résultat du test est négatif

LR- =Cote post-test

Cote pré-test=

1 - Sensibilité

Spécificité

Objectifs :

Test BTest A

A – & B –A + & B –A - & B +A + & B +

- +- +

Tests en parallèle :

Exercice (2 tests en parallèle) :

Condition d’indépendance entre les tests !

� TA

� TB

� TATB

VPP VPN

� Test A (TA) : Se = 90% ; Sp = 80%

� Test B (TB) : Se = 70% ; Sp = 60%

� Taux de Prévalence (Pr) = 10%

VPP de 2 tests positifs effectués en parallèle :

Pr x (SeTA) x (SeTB)

[Pr x (SeTA) x (SeTB)] + [(1-Pr) x (1-SpTA) x (1-SpTB)]

VPN de 2 tests négatifs effectués en parallèle :

(1-Pr) x (SpTA) x (SpTB)

[(1-Pr) x (SpTA) x (SpTB)] + [Pr x (1-SeTA) x (1-SeTB)]

Exercice (2 tests en parallèle) :

Condition d’indépendance entre les tests !

� TA 33,3 98,6

� TB 16,3 94,7

� TATB 46,7 99,3

VPP (%) VPN (%)

� Test A (TA) : Se = 90% ; Sp = 80%

� Test B (TB) : Se = 70% ; Sp = 60%

Deux tests en parallèle :

� Lorsque les 2 tests sont positifs :

VPP améliorée

� Lorsque les 2 tests sont négatifs :

VPN améliorée

�� Applicable à n tests…

Test B

Test A

Tests en série :

Test B

A + puis

A –puis

A + puis

Exercice (2 tests en série) :

� TA

� TB siTA+

� TB siTA-

VPP (%) VPN (%)

� Test A (TA) : Se = 90% ; Sp = 80%

� Test B (TB) : Se = 70% ; Sp = 60%

Exercice (2 tests en série) :

Le test A modifie la probabilité pré-test B

� TA 33,3 98,6

� TB siTA+ 47

� TB siTA- 99,3

VPP (%) VPN (%)

� Test A (TA) : Se = 90% ; Sp = 80%

� Test B (TB) : Se = 70% ; Sp = 60%

Absence d’argument immunologique en faveur

d’une cysticercose

Taux limite d’anticorps nepermettant pas d’affirmer

une cysticercose

0-10 u > ou = 35 u10 u < Titre < 35 u

Western Blot

Présence d’anticorps enELISA dont la spécificité

n’est pas confirmée

CYSTICERCOSEIMMUNOLOGIQUE

Négatif Positif

SEROLOGIE DE LA CYSTICERCOSE

INTERPRETATION

SEROLOGIE DISTOMATOSE

IEP≤320 >320

faveur d’unedistomatose

Code 0Taux moyen

d’anticorps enhémagglutination

non confirmés en ES

Code dh

faveur d’unedistomatose

Code 0

Distomatoseimmunologique

Code 1

Absence d’argument

Immunologique en

Faveur de

Larva migrans

SEROLOGIE DE TOXOCAROSE

Résultats sérologiques

en faveur d'une

Larva migrans

viscérale

Anticorps en ELISA

non confirmés en ES et en

WB. Possibilité de Larva migrans

viscérale ancienne ou d'une réaction

croisée avec une autre nématodose.

ELISA ES

>50 ≤50 +-

Résultats sérologiques

en faveur d'une

Larva migrans

viscérale

Code wb+

Code 0

Code wb-

SEROLOGIE HYDATIDOSE

ELISA ES

+ (arc 5)-

Hydatidoseimmunologique

≥640

faveur d’unehydatidose

Code 0

Hydatidoseimmunologique

Code 1

50≤ <75

≤320 ≥640

Taux d’Ac en ELISAdont la spécificitéhydatique ne peut

Être affirmée.

Code 1Code de

WBDemande du

biologiste si

forte suspicion

Diagnostic versus Dépistage

Diagnostic Dépistage

� Milieu clinique : Pr forte

� Nbre de FP faible

� Pb des FP ++

� ↑ Sp ↓ FP

� Pr faible

� Nbre de FP ++

� donc ↑ spécificité

� Groupes à risque

� Second test

Analyse décisionnelle

1. Validité intrinsèque

2. Validité pédictive

3. “Fréquence” de la maladie

4. Gravité de la maladie

5. Efficacité du traitement

6. Risques du traitement

7. Coûts (humain et financier) du test

8. “Coûts” (humain et financier) du traitement

9. Objectif du test : dépistage ou diagnostic ?

Objectifs :

Choix du seuil d’un test diagnostique :

Trouver un compromis entre les FP et les FN

Bayes et p-value

Choix du seuil α d’un test statistique :

Pas d’erreurErreur

de type I

Trouver un compromis entre α et β

Bayes et p-value

Populations

Pas d’erreurErreur de

type II

Bayes et p-value

� Si le test de laboratoire mesure la concentration

d’une substance, celle-ci doit être considérée tellequelle sans se préoccuper des FP et des FN

�� (il n’y pas de résultat négatif ou positif)

� Si la p-value est un moyen de décrire ou de résumer les données, nul besoin de se préoccuper des erreurs de type I et II �� (le résultat n’est ni significatif ni non-significatif)

Spécificité et risque α

� Test diagnostique : Si le patient n’est pas malade, la probabilité que le test donne un résultat positif

= 1- Sp

� Test statistique : Si les 2 populations ont les

mêmes moyennes (ou %ions), la probabilité quel’étude mette en évidence une différencestatistiquement significative

Sensibilité et risque β

� Test diagnostique : Si le patient est malade, la probabilité que le test donne un résultat positif

� Test statistique : S’il existe une différence ∆ entre

les moyennes (ou %ions) des 2 populations, la probabilité que l’étude mette en évidence unedifférence statistiquement significative

= 1- β

Question posée :

� Dans quelle proportion de l’ensemble des étudesqui donnent de p-values significativesl’hypothèse nulle est-elle vraie ?

� Si un résultat est statistiquement significatif, quelle est la probabilité que l’hypothèse nullesoit vraie ?

Exemple :

Quelle est la probabilité de chacune de ces possibilités ?

� Un nouveau médicament génère une baisse significativede la moyenne de la PA : 2 possibilités

� Ce médicament est réellement anti-HTA

� Ce médicament n’est pas anti-HTA, le résultat est le fait du hasard

� Etude de médicaments potentiellement anti-HTA

� ∆ = 10 mmHg

� Effectifs offrant une puissance = 80%

� Risque α = 0,05

Médicament A :

�� 64% de chance qu’il soit réellement efficace

� ≠ significative 80 45 125

� ≠ non significative 20 855 875

� Total 100 900 1000

efficace inefficace Total

� Appartient à une famille instable, faible affinité, etc.

� Probabilité a priori = 10%

Médicament B :

�� 98,5% de chance qu’il soit réellement efficace

� Total 800 200 1000

� Bonne affinité, stable, bloque les bons récepteurs

Médicament C :

�� 14% de chance qu’il soit réellement efficace

� Total 10 990 1000

� Sélectionné au hasard dans une banque de produits

� Résultat

� Objectif

� Erreurs

� Seuil

� Précision

� Interprétation

� Comparaisons

multiples

Test diagnostique Test statistique

+ / - S / NS

M ou ךM H0 ou H1

FN & FP α & β

Compromis entre Compromis entre

% de bien classés Puissance

VPP ou VPN Probabilité

Tests Correction

FN et FP α et β

en série de Bonferoni

que la ≠ soit vraie

Objectifs atteints ? :

Initiation à la logique Bayésienne

Health & Medicine

1. Initiation à la logique Comptable

Modélisation Bayésienne par chaines de Markov Monte Carlo

Logique machine-humainelogique machine logique Homme

Université de Montréal Régression logistique bayésienne

L'échantillonnage de Gibbs pour l'estimation bayésienne dans … · 2014-11-01 · L'ÉCHANTILLONNAGE DE GIBBS POUR L'ESTIMATION BAYÉSIENNE DANS L'ANALYSE DE SURVIE. ... 3.8 Estimation

La philosophie et l'expérience de la statistique bayésienne

Programmation bayésienne des robots

Logique du premier ordre (Logique de prédicats)

Méthode “logique” multivaluée de René Thomas et logique ...bernot/Teaching/2013-ecoleRRB-Porquerolles.pdf · Méthode “logique” multivaluée de René Thomas et logique

logique propositionnelle, 1 1cm Logique séance 2mikael.cozic.free.fr/logique-avancee-1112/logique-avancee-1112-LP1 … · la LP I la logique propositionnelle (LP) traite exclusivement

Planification et analyse d'expériences numériques: approche bayésienne

Estimation bayésienne linéaire en population finie en

Estimation de copules, une approche bayésienne

Programme L3 Informatiquefs.univ-boumerdes.dz/Programmes d'études/Informatique...- Initiation à la programmation en logique : application de certaines notions vues en cours de logique

Julien Diard LPNC-CNRS Cours M2R Sciences Cognitives, « Cognition bayésienne » 2009 Comparaison et sélection Bayésienne de modèles Julien Diard Laboratoire

Introduction à la statistique bayésienne 2012 E Parent.pdfIntroduction à la statistique bayésienne Paris, 26 janvier 2012, Séminaire JEM SFES Pavillon Dauphine Place du Maréchal

Logique séquentielle. Définition Définition En logique combinatoire, le niveau de la sortie dépend directement du niveau logique des entrées : En logique

Introduction à la logique : logique propositionnelle

I&G- chapitre 11-La logique Logarithmique -Mme Roulaud 1 Initiation au système dinformation et aux bases de données: la logique logarithmique Voir les

Statistique bayésienne et applications en génétique des populations