Interprétation du théorème de Bayes appliqué aux résultats positifs de la mammographie


11

J'essaie de comprendre le résultat du théorème de Bayes appliqué à l'exemple de la mammographie classique, la torsion de la mammographie étant parfaite.

C'est,

Incidence du cancer:.01

Probabilité d'une mammographie positive, étant donné que le patient a un cancer:1

Probabilité d'une mammographie positive, étant donné que le patient n'a pas de cancer:.01

Par Bayes:

P (cancer | mammographie +) =1.01(1.01)+(.091.99)

=.5025

Donc, si une personne au hasard de la population passe la mammographie et obtient un résultat positif, il y a 50% de chances qu'elle ait un cancer? Je n'arrive pas à comprendre intuitivement comment la minuscule chance de 1% d'un faux positif dans 1% de la population peut déclencher un résultat de 50%. Logiquement, je penserais qu'une mammographie positive parfaitement vraie avec un minuscule taux de faux positifs serait beaucoup plus précise.


2
Le taux de faux positifs n'est pas sur 1% mais plutôt sur 99% de la population. C'est pourquoi vous obtenez une probabilité qui peut sembler faible, en raison de la très forte probabilité antérieure qu'une personne soit en bonne santé. Gardez également à l'esprit qu'il ne s'agit que d'un seul test, que se passe-t-il si vous passez le test plus d'une fois? Ensuite, la précision du test commence à avoir plus d'importance.
dsaxton

S'il s'agit d'une mammographie parfaite, le taux de faux positifs serait nul, puis p (C | M) = 1 * 0,01 / (1 * 0,01 + 0 * 0,99) = 1,0 À mesure que le taux de faux positifs de la mammographie approche perfection (0) puis le deuxième terme en bas se rapproche de zéro. Le «minuscule» taux de faux positifs se combine avec le taux de base tout aussi minuscule pour rendre le résultat contre-intuitif.
Dave X

fwiw mon expérience suggère que la logique, du type déductif formel, est une chose merveilleuse mais génère des intuitions extrêmement mauvaises sur l'inférence probabiliste. Les outils ici bmj.com/content/343/bmj.d6386 peuvent aider votre intuition.
conjugateprior

À ma connaissance, la question demande une intuition sur la façon dont la probabilité conditionnelle peut être si faible compte tenu des hypothèses; pas sur les statistiques réelles de mammographie réelle (dont les réponses semblent concerner).
Juho Kokkala

Je pense qu'il y a une faute de frappe dans le dénominateur (le 2ème terme devrait être (.01 * 0.99)? Le résultat est correct cependant. Pas vraiment une intuition mais en simplifiant vous avez P (C | +) = P (C) / (P (C) + (P (+ |! C) P (! C)) et P (C) est très faible. Donc P (C | +) est extrêmement sensible à P (+ |! C), c'est-à-dire que vous auriez besoin de P ( + |! C) << P (C) pour que P (C | +) approche 1
David Waterworth

Réponses:


11

Je répondrai à cette question tant d'un point de vue médical que statistique. Il a reçu beaucoup d'attention dans la presse profane, en particulier après le best-seller The Signal and the Noise de Nate Silver, ainsi qu'un certain nombre d'articles dans des publications telles que le New York Times expliquant le concept. Je suis donc très heureux que @ user2666425 ait ouvert ce sujet sur CV.

Tout d'abord, permettez-moi de préciser que le n'est pas précis. Je peux vous dire que ce chiffre serait un rêve devenu réalité. Malheureusement, il y a beaucoup de mammographies faussement négatives , en particulier chez les femmes ayant un tissu mammaire dense. Le chiffre estimé peut être de ou plus , selon que vous regroupez tous les différents types de cancers du sein en un (invasif contre DCIS) et d'autres facteurs. C'est la raison pour laquelle d'autres modalités basées sur la technologie échographique ou IRM sont également appliquées. Une différence entre et est critique dans un test de dépistage.20 % 0,8 1p(+|C)=120%0,81

Le théorème de Bayes nous dit que , et a récemment attiré beaucoup d'attention en ce qui concerne à la mammographie chez les femmes plus jeunes à faible risque . Je me rends compte que ce n'est pas exactement ce que vous demandez, que j'aborde dans les derniers paragraphes, mais c'est le sujet le plus débattu. Voici un avant-goût des enjeux:p(C|+)=p(+|C)p(+)p(C)

  1. Les antécédents (ou la probabilité d'avoir un cancer en fonction de la prévalence) chez les patients plus jeunes , par exemple de 40 à 50 ans, sont plutôt faibles. Selon le NCI, il pourrait l'arrondir à (voir tableau ci-dessous). Cette probabilité pré-test relativement faible en soi réduit la probabilité conditionnelle post-test d'avoir un cancer étant donné que la mammographie était positive, indépendamment de la probabilité ou des données collectées.1,5%

  2. La probabilité d'un faux positif devient un problème très important sur une procédure de dépistage qui sera appliquée à des milliers et des milliers de femmes a priori en bonne santé. Ainsi, bien que le taux de faux positifs de (qui est beaucoup plus élevé si vous vous concentrez sur le risque cumulé ) puisse ne pas sembler si mauvais, c'est en fait un problème de coûts psychologiques et économiques colossaux, en particulier compte tenu de la faible pré- probabilité de test chez les patients plus jeunes à faible risque. Votre chiffre de est largement hors de propos - la réalité est que les "peurs" sont incroyablement courantes en raison de nombreux facteurs, y compris les préoccupations médico-légales.1 %7-dix%1%

Donc, recalculant et très important, pour les jeunes femmes sans facteurs de risque :

p(C|+)=p(+|C)p(+)p(C)=

=p(+|C)p(+|C)p(C)+p(+|C¯)p(C¯)p(C)=0,80,80,015+0,070,9850,015=0,148 .

La probabilité d'avoir un cancer lorsqu'une mammographie de dépistage a été lue comme positive peut être aussi faible que chez les jeunes femmes à faible risque. Soit dit en passant, les lectures mammographiques sont accompagnées d'une estimation indirecte de la confiance dans le diagnostic du radiologue (il s'appelle BI-RADS), et cette analyse bayésienne changerait radicalement à mesure que nous progressons d'un BI-RADS 3 à un BI-RADS 5 - tous des tests «positifs» au sens large.15%

Ce chiffre peut logiquement être modifié en fonction des estimations que vous considérez dans votre calcul, mais la vérité est que les recommandations concernant l'âge de départ pour entrer dans un programme de mammographie de dépistage ont récemment été repoussées de à4045 .

Chez les femmes âgées, la prévalence (et donc la probabilité du prétest) augmente linéairement avec l'âge. Selon le rapport actuel, le risque qu'une femme soit diagnostiquée d'un cancer du sein au cours des 10 prochaines années , à partir des âges suivants, est le suivant:

Age 30 . . . . . . 0.44 percent (or 1 in 227)
Age 40 . . . . . . 1.47 percent (or 1 in 68)
Age 50 . . . . . . 2.38 percent (or 1 in 42)
Age 60 . . . . . . 3.56 percent (or 1 in 28)
Age 70 . . . . . . 3.82 percent (or 1 in 26)

Il en résulte un risque cumulatif à vie d'environ :dix%

Le calcul chez les femmes âgées avec une prévalence de serait:4%

p(C|+)=0,80,80,04+0,070,960,04=0,3232% inférieur à ce que vous avez calculé.

Je ne saurais trop insister sur le nombre de "peurs" qu'il y a même dans les populations plus âgées. En tant que procédure de dépistage, une mammographie est simplement la première étape.Il est donc logique d'interpréter la mammographie positive car il est possible que la patiente souffre d'un cancer du sein, ce qui justifie un examen supplémentaire par échographie, des tests mammographiques supplémentaires (diagnostiques), mammographies de suivi, IRM ou biopsie. Si le était très élevé, nous n'aurions pas affaire à un test de dépistage, ce serait un test de diagnostic , comme une biopsie.p(C|+)

Réponse spécifique à votre question:

Ce sont les "peurs", le de , et non comme dans le PO, en combinaison avec une prévalence relativement faible de la maladie (faible probabilité de prétest ou élevée ) en particulier chez les femmes plus jeunes, ce qui explique cette probabilité post-test plus faible à travers les âges. p(+|C¯)7-dix%1%p(C¯)Notez que ce "taux de fausses alertes" est multiplié par la proportion beaucoup plus importante de cas sans cancer (par rapport aux patients atteints de cancer) dans le dénominateur, et non par "la minuscule chance de 1% d'un faux positif dans 1% de la population" que vous mention. Je pense que c'est la réponse à votre question. Pour souligner, bien que cela soit inacceptable dans un test de diagnostic, cela vaut toujours la peine dans une procédure de dépistage.

Problème d' intuition: @Juho Kokkala a soulevé le problème que l'OP posait à propos de l' intuition . Je pensais que cela était impliqué dans les calculs et les derniers paragraphes, mais assez juste ... C'est ainsi que je l'expliquerais à un ami ... Imaginons que nous partions à la recherche de fragments de météores avec un détecteur de métaux à Winslow, en Arizona. Ici:

Image de meteorcrater.com

... et le détecteur de métaux se déclenche. Eh bien, si vous avez dit que les chances sont que c'est à partir d'une pièce de monnaie qu'un touriste a déposé, vous auriez probablement raison. Mais vous obtenez l'essentiel: si l'endroit n'avait pas été filtré de manière aussi approfondie, il serait beaucoup plus probable qu'un bip du détecteur sur un endroit comme celui-ci provienne d'un fragment de météore que si nous étions dans les rues de New York.

Ce que nous faisons avec la mammographie va à une population en bonne santé, à la recherche d'une maladie silencieuse qui, si elle n'est pas détectée tôt, peut être mortelle. Heureusement, la prévalence (bien que très élevée par rapport à d'autres cancers moins guérissables) est suffisamment faible pour que la probabilité de rencontrer au hasard un cancer soit faible, même si les résultats sont "positifs" , et en particulier chez les jeunes femmes.

En revanche, s'il n'y avait pas de faux positifs, c'est-à-dire ( ,p(C¯|+)=0

p(+|C)p(+|C)p(C)+p(+|C¯)p(C¯)p(C)=p(+|C)p(+|C)p(C)p(C)=1 , autant que la probabilité d'avoir touché un fragment de météore si notre détecteur de métaux s'éteignait serait indépendant de la zone que nous explorions si, au lieu d'un détecteur de métaux ordinaire, nous utilisions un instrument parfaitement précis pour détecter les acides aminés de l'espace extra-atmosphérique dans le météore fragment (exemple inventé). Il serait encore plus probable de trouver un fragment dans le désert de l'Arizona qu'à New York, mais si le détecteur émettait un bip, nous saurions que nous avions trouvé un météore.100%

Comme nous n'avons jamais un appareil ou un système de mesure parfaitement précis, la fraction sera , et plus il est imparfait, moins il sera la fraction du , ou antérieure , qui sera "transmise" à la LHS de l'équation en tant que postérieure . Si nous nous installons sur un type particulier de détecteur, la fraction de vraisemblance agira comme constante dans une équation linéaire de la forme, , oùprobabilitép inconditionnel (+)=p(+|C)p(+|C)p(C)+p(+|C¯)p(C¯)<1p(C)postérieur=αavantpostérieur<avant, et plus le antérieur est petit, plus le postérieur sera linéaire. C'est ce que l'on appelle la dépendance à l'égard de la prévalence de la valeur prédictive positive (VPP) : probabilité que les sujets avec un test de dépistage positif aient réellement la maladie.


5

Un problème clé de la mammographie qui n'a pas été abordé de manière adéquate dans le discours est la définition erronée du "positif". Ceci est décrit dans le chapitre Diagnostic de http://biostat.mc.vanderbilt.edu/ClinStat - voir le lien pour la biostatistique dans la recherche biomédicale là-bas.

L'un des systèmes de codage diagnostique les plus utilisés en mammographie est le score BI-RADS, et un score de 4 est un résultat "positif" fréquent. La définition de la catégorie 4 est «non caractéristique du cancer du sein, mais probabilité raisonnable d'être malin (3 à 94%); une biopsie doit être envisagée». Avec une plage de risque allant de 0,03 à 0,94 pour une catégorie , c'est-à-dire une hétérogénéité incroyable dans ce que signifie réellement le «positif», il n'est pas étonnant que nous ayons un gâchis entre les mains.

C'est aussi un signe de pensée peu claire que le système BI-RADS n'a pas de catégorie pour quelqu'un avec un risque estimé à 0,945.

Comme Nate Silver le dit avec tant d'éloquence dans The Signal and the Noise , si nous devions penser de manière probabiliste, nous prendrions de meilleures décisions tout autour. La suppression de termes tels que «positif» et «négatif» pour les tests médicaux éliminerait les faux positifs et les faux négatifs et véhiculerait l'incertitude (et la justification de plus de tests avant de poser un diagnostic) de manière optimale.


Nous écrivions en synchronisation pratique - consultez mes commentaires ci-dessous sur BI-RADS. Je ne pourrais pas être plus d'accord (des tonnes d'expérience personnelle à ce sujet en tant que radiologue).
Antoni Parellada

3

Il y a une belle discussion à ce sujet dans le livre Risques calculés

Une grande partie du livre consiste à trouver des façons plus claires de parler et de réfléchir à la probabilité et au risque. Un exemple:

La probabilité qu'une femme de 40 ans souffre d'un cancer du sein est d'environ 1%. Si elle a un cancer du sein, la probabilité qu'elle soit positive à une mammographie de dépistage est d'environ 90%. Si elle n'a pas de cancer du sein, la probabilité qu'elle soit néanmoins positive est de 9%. Quelles sont les chances qu'une femme dont le test est positif a effectivement un cancer du sein?

C'est ainsi que le livre présente la solution, en utilisant des «fréquences naturelles». Considérons 10 000 femmes, 1% ont un cancer, soit 100 femmes. Parmi ceux-ci, 90% renverront des tests positifs (c'est-à-dire que 90 femmes atteintes de cancer seront testées positives). Sur les 9900 sans cancer, 9% rapporteront un test positif ou 891 femmes. Il y a donc 891 + 90 = 981 femmes avec des tests positifs dont 90 ont un cancer. Donc, la chance qu'une femme avec un test positif ait un cancer est de 90/981 = 0,092

Si 100% des femmes atteintes d'un cancer ont un résultat positif, cela change un peu les chiffres à 100 / (100 + 891) = 0,1

Approche de la fréquence naturelle pour comprendre les faux positifs


1

Peut-être que cette ligne de pensée est correcte?:

.011

0,0025


1

Voici une façon simpliste mais intuitive de voir les choses. Considérons 100 personnes. L'un a le cancer et sera positif. Sur les 99 qui ne le font pas, l'un d'entre eux recevra un faux test positif. Donc, des deux points positifs, l'un aura un cancer et l'autre non.

En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.