42
Probabilités Pr. François Kohler [email protected]

Probabilités Pr. François Kohler [email protected] [email protected]

Embed Size (px)

Citation preview

Page 1: Probabilités Pr. François Kohler kohler@medecine.uhp-nancy.fr kohler@medecine.uhp-nancy.fr

ProbabilitésPr. François Kohler

[email protected]

Page 2: Probabilités Pr. François Kohler kohler@medecine.uhp-nancy.fr kohler@medecine.uhp-nancy.fr

Expérience aléatoire, événement aléatoire

• Une expérience est dite aléatoire (random experiment-random trial) lorsqu'on ne peut pas en prévoir exactement les résultats du fait que tous les facteurs qui déterminent ce résultat ne sont pas maîtrisés ou contrôlés.

• Un événement aléatoire est un événement qui peut ou ne pas se réaliser au cours d'une expérience aléatoire.

• Exemple : expérience aléatoire "traverser la route" - événement aléatoire "se faire écraser".

Page 3: Probabilités Pr. François Kohler kohler@medecine.uhp-nancy.fr kohler@medecine.uhp-nancy.fr

Définition classique

• Si m résultats peuvent se produire avec des chances égales et si k résultats correspondent à la réalisation de l'événement, la probabilité de l'événement est le rapport k/m : nombre de cas favorables sur nombre de cas possibles.

• Par exemple, dans un jeu de 52 cartes, on a 13 coeurs, si toutes les cartes ont des chances égales d'être tirées, la probabilité d'extraire un cœur est 13/52 = 0,25

Page 4: Probabilités Pr. François Kohler kohler@medecine.uhp-nancy.fr kohler@medecine.uhp-nancy.fr

Définition fréquentielle• Si une expérience a été répétée un grand

nombre de fois dans des conditions uniformes, on constate généralement que la fréquence relative (% de réalisation) d'un événement (fi) se stabilise.

• Ce phénomène est connu sous le nom de régularité statistique.

• Ce nombre fixe est par définition la probabilité mathématique de l'événement considéré.

Page 5: Probabilités Pr. François Kohler kohler@medecine.uhp-nancy.fr kohler@medecine.uhp-nancy.fr

Définition fréquentielle

• La probabilité ainsi définie est une forme idéalisée de la fréquence relative.

• Une estimation pragmatique de la probabilité d’un événement est fournie par la fréquence relative, la précision de cette estimation peut être fournie par son intervalle de confiance pour un risque donné.

• Dans de nombreux cas, la probabilité peut être modélisée par une loi.

Page 6: Probabilités Pr. François Kohler kohler@medecine.uhp-nancy.fr kohler@medecine.uhp-nancy.fr

Expérience, événement, propositions, logique…

• Evénement : toute proposition logique associée aux résultats de l’expérience.

• Représentation ensembliste : – Diagramme de Venn

S ensemble des événements possiblesA sous-ensemble de SB sous-ensemble de S….

Page 7: Probabilités Pr. François Kohler kohler@medecine.uhp-nancy.fr kohler@medecine.uhp-nancy.fr

Evénements exclusifs

• Les événements A et B ne peuvent se produire simultanément. Pour tous couples (A,B) l'ensemble A* B est vide.– Exemple : extraire un cœur ou un carreau.

• Si 2 événements sont exhaustifs et mutuellement exclusifs (mort-vivant) – La non-réalisation de l’un implique la réalisation

de l’autre.

Page 8: Probabilités Pr. François Kohler kohler@medecine.uhp-nancy.fr kohler@medecine.uhp-nancy.fr

Evénements non exclusifs

• Les événements peuvent se produire simultanément .

• L’intersection n’est pas vide.• Exemple :

• Extraire une dame et un carreau• Avoir un diabète et rouler avec des pneus lisses.• Avoir un diabète et une angine.

• Ne pas confondre événements exclusifs et événements indépendants.

Page 9: Probabilités Pr. François Kohler kohler@medecine.uhp-nancy.fr kohler@medecine.uhp-nancy.fr

Opérateurs logiques

• On note Vrai 1, Faux 0.

A BA ou B; A U B; A+B

A et B; AB; A*B

Non(A) Non(B) Non(AouB) Non(AetB)Non(A)

et Non(B)

Non(A) ou

Non(B)

1 1 1 1 0 0 0 0 0 01 0 1 0 0 1 0 1 0 10 1 1 0 1 0 0 1 0 10 0 0 0 1 1 1 1 1 1

Page 10: Probabilités Pr. François Kohler kohler@medecine.uhp-nancy.fr kohler@medecine.uhp-nancy.fr

Rappel de logique

A B

A et B A ou B

Non(A) Non(B)

Non(A ou B)Non(A et B)

Page 11: Probabilités Pr. François Kohler kohler@medecine.uhp-nancy.fr kohler@medecine.uhp-nancy.fr

Rappels de logique

• Théorèmes de De Morgan– Non(A et B) = Non(A) ou Non(B)– Non(A ou B) = Non(A) et Non(B)

• La plupart des problèmes de probabilités n’ont comme difficulté que l’interprétation logique de l’énoncé.

Page 12: Probabilités Pr. François Kohler kohler@medecine.uhp-nancy.fr kohler@medecine.uhp-nancy.fr

Axiomes élémentaires• 0 < P(A) < 1 : Une probabilité est toujours comprise entre 0 et 1.• P(A) = 1 : L’événement est toujours réalisé.• P(A) = 0 : L’événement est impossible.• Si 2 événements sont exclusifs :

– P(A ou B) = P(A + B) = P(A U B) = P(A) + P(B)• Exemple : Probabilité d'extraire un cœur ou un carreau = P(Cœur ou Carreau) = 0,25 +

0,25 = 0,5.

– Généralisation P(A+B+C) = P(A)+P(B)+P(C).– Si 2 événements sont mutuellement exclusifs (mort-vivant) et

constituent l’ensemble des possibles :• on a P(A)+P(B) = 1 => P(A) = 1-P(B).

– La probabilité de survie à un moment donné est égale à 1 moins la probabilité de décéder à ce moment.

Page 13: Probabilités Pr. François Kohler kohler@medecine.uhp-nancy.fr kohler@medecine.uhp-nancy.fr

Evénements non exclusifs• Les événements peuvent se produire simultanément. Exemples :

« avoir un infarctus du myocarde », « être diabétique ».• P(A ou B) = P(B ou A)

= P(A) + P(B) - P(A et B)• Ceci se déduit des relations :

– P(A ou B) = P(A sans B) + P(B sans A) + P(A et B)– P(A sans B) = P(A) - P(A et B)– P(B sans A) = P(B) - P(A et B)

• En conclusion :– P(A ou B) < P(A) + P(B)– P(A ou B ou C) = P(A) + P(B) + P(C) - P(A et B) - P(B et C) - P(A et C) +

P(A et B et C)

Page 14: Probabilités Pr. François Kohler kohler@medecine.uhp-nancy.fr kohler@medecine.uhp-nancy.fr

Probabilités conditionnelles et indépendance

• En médecine, l’utilisation des probabilités conditionnelles est fréquente et apparaît naturelle. – On dira que « un individu a 5 fois plus de chances de

développer une maladie coronarienne s’il fume un paquet de tabac par jour que si il ne fume pas »…

• La connaissance n’est pas figée : avant la réalisation d’un test, la probabilité d’une maladie est p. Que devient-elle si on sait que le test est positif ?

Page 15: Probabilités Pr. François Kohler kohler@medecine.uhp-nancy.fr kohler@medecine.uhp-nancy.fr

Probabilité conditionnelle

• Soit deux événements non exclusifs A et B : – On regarde la probabilité que l’un se réalise alors

que l’autre est déjà réalisé.

• On note P(A/B) la probabilité de A si B est réalisé, l’inversement du conditionnement P(B/A) est la probabilité de B si A est réalisé.

• Quelle est la probabilité d’avoir une douleur de la fosse illiaque droite alors que l’on a une appendicite ?

• Quelle est la probabilité d’avoir une appendicite alors que j’observe une douleur dans la fosse iliaque droite ?

Page 16: Probabilités Pr. François Kohler kohler@medecine.uhp-nancy.fr kohler@medecine.uhp-nancy.fr

Probabilité conditionnelle

)(*)/()(*)/()()(

)(

)()/(

APABPBPBAPABPBAP

BP

BAPBAP

• Eléments de base :

• Indépendance :– Deux événements sont indépendants si la réalisation

de l’un n’influence pas la réalisation de l’autre.• Exemple : Pluie, rouler avec des pneus lisses : a priori

indépendant; pluie, avoir un accident a priori non indépendant.

Page 17: Probabilités Pr. François Kohler kohler@medecine.uhp-nancy.fr kohler@medecine.uhp-nancy.fr

Indépendance

• P(A/B) = P(AB)/P(B) = P(A)=> P(AB) = P(A)*P(B)

• Si et seulement si deux événements sont indépendants alors P(A et B) = P(A) * P(B)

Page 18: Probabilités Pr. François Kohler kohler@medecine.uhp-nancy.fr kohler@medecine.uhp-nancy.fr

Inversion du conditionnement

• Intérêt : évaluation des examens complémentaires.• Théorème de Bayes :

)](1[*)]/(1[)(*)/()(

)(*)/()(*)/()(

)/(1)/(

)(1)(

)(

)(*)/(

)(

)()/(

)(*)/()()(

)()/(

BPBNonANonPBPBAPAP

BNonPBNonAPBPBAPAP

BNonANonPBNonAP

BPBNonP

AP

BPBAP

AP

BAPABP

BPBAPBAPBP

BAPBAP

B

Non B

A

Non A

A

Non A

P(A/B)

P(B)

P(A)/nonB)

Page 19: Probabilités Pr. François Kohler kohler@medecine.uhp-nancy.fr kohler@medecine.uhp-nancy.fr

Le tableau à 4 cases

• En médecine, 2 tableaux à 4 cases sont très utilisés et renvoient au conditionnement.– Evaluation des signes et

examens complémentaires.

– Recherche de facteurs de risque.

Maladie + Maladie - TotalTest + A (VP) B (FP) T+=A+B=VP+FPTest - C (FN) D (VN) T-=C+D=FN+VNTotal M+ = A+C = VP+FN M-=B+D=FP+VN n

Maladie + Maladie - Total

Exposés A B E+=A+B

Non exposés C D E-=C+D

M+ = A+C M- = B+D A+B+C+D

P(T+/M+); P(T-/M-); P(M+/T+); P(M-/T-)

P(M+/E+); P(M+/E-); P(E+/M+);P(E-/M-)

Page 20: Probabilités Pr. François Kohler kohler@medecine.uhp-nancy.fr kohler@medecine.uhp-nancy.fr

Les arbres de décision

• Un homme se présente aux urgences. Quelle est la probabilité qu’il ait une sténose coronarienne ?

( Coro+) = P (EE+ Coro+) + P (EE- Coro+) = 0,8*0,6 + 0,4*0,3= 0,48 + 0,12 = 0,60

Page 21: Probabilités Pr. François Kohler kohler@medecine.uhp-nancy.fr kohler@medecine.uhp-nancy.fr

Evaluation des examens complémentaires

• Il n’existe pas de signe ou d’examen parfait qui serait toujours présent en cas de présence de la maladie et absent en cas d’absence de la maladie.

Maladie + Maladie - Total

Test + A (VP) B (FP) T+=A+B=VP+FP

Test - C (FN) D (VN) T-=C+D=FN+VN

TotalM+ = A+C =

VP+FNM-

=B+D=FP+VN N=A+B+C+D

Fréquence de la maladie = Prévalence=P(M+) = (VP+FN)/N

Sensibilité = P(T+/M+) = VP/(VP+FN)Spécificité = P(T-/M-)= VN/(VN+FP)VPP = P(M+/T+) = VP/(VP+FP)VPN = P(M-/T-) = VN/(VN+FN)

Page 22: Probabilités Pr. François Kohler kohler@medecine.uhp-nancy.fr kohler@medecine.uhp-nancy.fr

Evaluation des examens complémentaires

• La prévalence de la maladie dépend de différents facteurs notamment :– Zone géographique : le paludisme est beaucoup plus

fréquent en Afrique qu’en France.– De la sélection réalisée par le premier niveau de soins

(la prévalence dans le groupe sélectionné est égale à la VPP du test qui a servi à la sélection).

– ….• La prévalence est la probabilité d’avoir la maladie

avant d’avoir fait le test : probabilité pré-test.

Page 23: Probabilités Pr. François Kohler kohler@medecine.uhp-nancy.fr kohler@medecine.uhp-nancy.fr

Evaluation des examens complémentaires

• Sensibilité (probabilités des tests positifs chez les malades) et spécificité (probabilités des tests négatifs chez les non malades) sont des caractéristiques intrinsèques du test.

• Elles supposent le problème résolu puisqu’ un test de référence (gold standard) a permis de déterminer si la personne était malade ou non.

• Elles sont influencées notamment par le stade évolutif de la maladie.

Page 24: Probabilités Pr. François Kohler kohler@medecine.uhp-nancy.fr kohler@medecine.uhp-nancy.fr

Evaluation des examens complémentaires

• La valeur prédictive positive (VPP = probabilité d’avoir la maladie si le test est positif) et la valeur prédictive négative (VPN = probabilité de ne pas avoir la maladie si le test est négatif) sont les éléments qui servent à la décision médicale.

• La VPP est la probabilité post-test. Dans le groupe des sujets ayant un test positif, elle représente la probabilité d’avoir la maladie.

• Si le généraliste utilise la positivité du test pour adresser les sujets au spécialiste, la fréquence de la maladie (prévalence) dans le groupe adressé au spécialiste sera la VPP.

Page 25: Probabilités Pr. François Kohler kohler@medecine.uhp-nancy.fr kohler@medecine.uhp-nancy.fr

Valeurs prédictives

• Les valeurs prédictives dépendent de :– La sensibilité du test,– La spécificité du test,– La prévalence du test.

• En conséquence, le même test (même sensibilité et spécificité) aura des VPP et VPN très différentes en fonction de la prévalence de la maladie.

Page 26: Probabilités Pr. François Kohler kohler@medecine.uhp-nancy.fr kohler@medecine.uhp-nancy.fr

Valeurs prédictives• VPP et VPN correspondent à

l’inversion du conditionnement de la sensibilité et de la spécificité.

• L’arbre des probabilités permet facilement cette opération.

Malade

Non Malade

Prévalence

1 - Prévalence

Test Positif

Test Positif

Test Négatif

Test Négatif

Sensibilité

1 - Sensibilité

1 - Spécificité

Spécificité

)1(*)1()*(

*

éspécificitprévalencesensibiltéprévalence

ésensibilitprévalenceVPP

)1(*)()(*)1(

)(*)1(

sensibiltéprévalenceéspécificitprévalence

éspécificitprévalenceVPN

Page 27: Probabilités Pr. François Kohler kohler@medecine.uhp-nancy.fr kohler@medecine.uhp-nancy.fr

VPP et VPN en fonction de la prévalence

• Pour une sensibilité et une spécificité donnée :– Une augmentation de la

prévalence entraîne une augmentation de la VPP.

– Une augmentation de la prévalence entraîne une diminution de la VPN. 0,00

0,10

0,20

0,30

0,40

0,50

0,60

0,70

0,80

0,90

1,00

0,00 0,10 0,20 0,30 0,40 0,50 0,60 0,70 0,80 0,90 1,00

Prévalence

VPP

VPN

Page 28: Probabilités Pr. François Kohler kohler@medecine.uhp-nancy.fr kohler@medecine.uhp-nancy.fr

Exemple• Le paludisme a une prévalence de 90% en

Afrique et de 0,001 en France. Un test biologique est utilisé pour le diagnostic avec une sensibilité de 95% et une spécificité de 85%. Quelles seront les probabilités pour des patients Africains et Français d’avoir le paludisme quand le test est positif et inversement de ne par avoir la maladie quand le test est négatif ?

• Conclusion : si le test est positif en Afrique, on est quasiment certain que le patient a le paludisme alors qu’en France on ne peut rien conclure. Par contre si le test est négatif, on est quasiment certain qu’en France le patient n’a pas de palu alors qu’en Afrique, on ne peut rien dire.

• => Attention au transfert d’expérience.

9999,0))95,01(*001,0(85,0*)001,01(

85,0*)001,01(

654,0))95,01(*9,0(85,0*)9,01(

85,0*)9,01(

006,0)85,01(*)001,01(95,0*001,0

95,0*001,0

983,0)85,01(*)9,01(95,0*9,0

95,0*9,0

VPNFrance

AfriqueVPN

VPPFrance

VPPAfrique

Page 29: Probabilités Pr. François Kohler kohler@medecine.uhp-nancy.fr kohler@medecine.uhp-nancy.fr

Rapports de vraisemblance• RV+ : L =

– Un sujet a L fois plus de chance d'avoir le test positif s'il est atteint de la maladie que dans le cas contraire.

• RV- :

• L'apport diagnostique d'un résultat positif du test est d'autant plus grand que le RV+ (L) est plus élevé. L'apport diagnostique d'un résultat négatif d'autant plus grand que le RV- est plus petit et proche de zéro.

• B.Grenier

Se

1 - Sp

Sp

Se

1

Page 30: Probabilités Pr. François Kohler kohler@medecine.uhp-nancy.fr kohler@medecine.uhp-nancy.fr

Diagramme de Fagan• Permet, sans calcul, de

déterminer la probabilité post-test à partir de la prévalence (probabilité pré-test) et du rapport de vraisemblance.(source HAS)

Prévalence = 10%L = 12

Page 31: Probabilités Pr. François Kohler kohler@medecine.uhp-nancy.fr kohler@medecine.uhp-nancy.fr

Dépistage, Confirmation diagnostique

• Dépistage :– S’adresse à des sujets ne se plaignant de

rien à priori sains.– Prendre un test à sensibilité élevée (peu de

FN, VPN très grande) .– Éventuellement suivi d’un test de

confirmation.– Ne pas oublier les autres éléments :

• Acceptabilité, Risque, Coût

• Confirmation d’une maladie suspectée :– Prendre un test avec une spécificité élevée

(peu de FP, VPP très grande) d’autant plus que le coût du faux positif est élevé.

Maladie + Maladie - Total

Test + A (VP) B (FP) T+=A+B=VP+FP

Test - C (FN) D (VN) T-=C+D=FN+VN

TotalM+ = A+C =

VP+FNM-

=B+D=FP+VN N=A+B+C+D

Page 32: Probabilités Pr. François Kohler kohler@medecine.uhp-nancy.fr kohler@medecine.uhp-nancy.fr

Valeurs diagnostiques d’un test

• Si un test a une spécificité élevée, un résultat positif confirme l’hypothèse diagnostic.

• Si un test a une sensibilité élevée, un résultat négatif élimine le diagnostic .(Règles de Sacket)

• Gain diagnostic positif :– C’est la différence entre la probabilité pré-test (prévalence)

de la maladie et la probabilité post-test (valeur prédictive positive).

– Gain positif = VPP – prévalence.

Page 33: Probabilités Pr. François Kohler kohler@medecine.uhp-nancy.fr kohler@medecine.uhp-nancy.fr

Et si le test consiste à comparer une valeur quantitative à une limite ?

• Si le résultat du test biologique ou du signe clinique est une variable quantitative (glycémie - diabète; tension artérielle systolique - hypertension ...), la sensibilité et la spécificité vont dépendre du seuil que l'on choisit pour dire que le test est positif ou négatif.

• Pour chaque valeur de la limite, on aura une valeur de la sensibilité et une valeur de la spécificité.

• Ceci conduit à la courbe de ROC.

Page 34: Probabilités Pr. François Kohler kohler@medecine.uhp-nancy.fr kohler@medecine.uhp-nancy.fr

Spécificité et sensibilité en fonction de la limite

Ici si l’on déplace la limite vers la droite, la spécificité va augmenter et le sensibilité va diminuer (diabète et glycémie par exemple).

Attention, il existe des cas inverse : taux d’hormones et hypothyroidie.

Page 35: Probabilités Pr. François Kohler kohler@medecine.uhp-nancy.fr kohler@medecine.uhp-nancy.fr

Courbe de ROC• A chaque valeur de la limite L du

critère quantitatif, on a une valeur de la sensibilité et de la spécificité. – On obtient ainsi 1 point de la courbe. – En faisant varier la limite L, on obtient

d’autres points. • La courbe joignant les points est la

courbe de ROC.• Les valeurs de sensibilité et spécificité

en fonction de L peuvent être obtenues par l’observation ou par la modélisation du phénomène par une loi de probabilité.

1

10

Sensibilité

1-Spécificité

Page 36: Probabilités Pr. François Kohler kohler@medecine.uhp-nancy.fr kohler@medecine.uhp-nancy.fr

Courbe de ROC

• Aire sous la courbe : AROC– Entre 0,5 (examen au hasard : pile ou face)

et 1 (examen parfait).– Instrument privilégié d’évaluation et de

comparaison des performances diagnostiques des examens complémentaires.

Page 37: Probabilités Pr. François Kohler kohler@medecine.uhp-nancy.fr kohler@medecine.uhp-nancy.fr

Importance de l’indépendance

• Indépendance est opposé à liaison.– Deux phénomènes sont indépendants si la réalisation

de l’un n’influence pas la réalisation de l’autre.– Deux phénomènes sont liés si la réalisation de l’un

influence la réalisation de l’autre.• Attention : Liaison ne veut pas dire causalité.• Indépendance = hypothèse nulle du test du Khi2

sous laquelle sont calculés les effectifs théoriques.

Page 38: Probabilités Pr. François Kohler kohler@medecine.uhp-nancy.fr kohler@medecine.uhp-nancy.fr

Application à la reproductibilité

• Problème fréquent en santé :– Deux médecins donnent

un avis sur l’opportunité de réaliser une intervention chirurgicale.

– Si la reproductibilité était parfaite les deux médecins seraient toujours d’accord. Mais…

Médecin AOui Non Total

Médecin B Oui 10 20 30Non 5 45 50Total 15 65 80

La concordance observée est : (10+45)/80 = 0,69

Page 39: Probabilités Pr. François Kohler kohler@medecine.uhp-nancy.fr kohler@medecine.uhp-nancy.fr

Reproductibilité• Si les deux jugements étaient indépendants,

quels auraient été les résultats ?

Les probabilités peuvent être approchées par les fréquences. Sous l’hypothèse d’indépendance, on obtient le tableau :

6,580

30*1580*

80

30*

80

15

:'80

30*

80

15)]/[()]/[(

''80

30)/(

80

15)/(

E

attenduseffectifsdtermesEn

BOuiPAOuiP

ceindépendandhypothèselSous

BOuiP

AOuiP

Médecin AOui Non Total

Médecin B Oui 10 20 30Non 5 45 50Total 15 65 80

Médecin AOui Non Total

Médecin B Oui 5,6 24,4 30Non 9,4 40,6 50Total 15 65 80

Page 40: Probabilités Pr. François Kohler kohler@medecine.uhp-nancy.fr kohler@medecine.uhp-nancy.fr

Reproductibilité

Concordance observée Cobs=(10+45)/80 = 0,69

Concordance sous hypothèse d’indépendance

Cthéo =(5,6+40,6)/80 = 0,58

Coefficient de Kappa

Médecin AOui Non Total

Médecin B Oui 10 20 30Non 5 45 50Total 15 65 80

Médecin AOui Non Total

Médecin B Oui 5,6 24,4 30Non 9,4 40,6 50Total 15 65 80

0,26 0,58-1

0,58-0,69

C-1

C-C

théo

théoobs Kappa

Si Kappa > 0,6 : bonne concordance

Page 41: Probabilités Pr. François Kohler kohler@medecine.uhp-nancy.fr kohler@medecine.uhp-nancy.fr

Application à la survie• Soit les événements Morts-Vivants

– P(Vivant) = 1 - P(Mort)– La probabilité d'être vivant au jour J et au jour J+1 est égale au produit des

probabilités d'être vivant au jour J et J+1.

Jour Exposés DCD PDV P(DCD) P(Viv.) Pcum(Viv)

0 100 0 0 0 1 1

1 100 3 0 0,03 0,97 1*0,97

6 97 2 0 2/97=0,0206 0,9794 0,97*0,9794

= 0,95002

7 95 0 3 0 1 0,95002

10 92 … … … … …

Page 42: Probabilités Pr. François Kohler kohler@medecine.uhp-nancy.fr kohler@medecine.uhp-nancy.fr