Je répondrai à cette question tant d'un point de vue médical que statistique. Il a reçu beaucoup d'attention dans la presse profane, en particulier après le best-seller The Signal and the Noise de Nate Silver, ainsi qu'un certain nombre d'articles dans des publications telles que le New York Times expliquant le concept. Je suis donc très heureux que @ user2666425 ait ouvert ce sujet sur CV.
Tout d'abord, permettez-moi de préciser que le n'est pas précis. Je peux vous dire que ce chiffre serait un rêve devenu réalité. Malheureusement, il y a beaucoup de mammographies faussement négatives , en particulier chez les femmes ayant un tissu mammaire dense. Le chiffre estimé peut être de ou plus , selon que vous regroupez tous les différents types de cancers du sein en un (invasif contre DCIS) et d'autres facteurs. C'est la raison pour laquelle d'autres modalités basées sur la technologie échographique ou IRM sont également appliquées. Une différence entre et est critique dans un test de dépistage.20 % 0,8 1p( + | C) = 120 %0,81
Le théorème de Bayes nous dit que , et a récemment attiré beaucoup d'attention en ce qui concerne à la mammographie chez les femmes plus jeunes à faible risque . Je me rends compte que ce n'est pas exactement ce que vous demandez, que j'aborde dans les derniers paragraphes, mais c'est le sujet le plus débattu. Voici un avant-goût des enjeux:p ( C| +)= p ( + | C)p ( + )∗ p ( C)
Les antécédents (ou la probabilité d'avoir un cancer en fonction de la prévalence) chez les patients plus jeunes , par exemple de 40 à 50 ans, sont plutôt faibles. Selon le NCI, il pourrait l'arrondir à (voir tableau ci-dessous). Cette probabilité pré-test relativement faible en soi réduit la probabilité conditionnelle post-test d'avoir un cancer étant donné que la mammographie était positive, indépendamment de la probabilité ou des données collectées.∼ 1,5 %
La probabilité d'un faux positif devient un problème très important sur une procédure de dépistage qui sera appliquée à des milliers et des milliers de femmes a priori en bonne santé. Ainsi, bien que le taux de faux positifs de (qui est beaucoup plus élevé si vous vous concentrez sur le risque cumulé ) puisse ne pas sembler si mauvais, c'est en fait un problème de coûts psychologiques et économiques colossaux, en particulier compte tenu de la faible pré- probabilité de test chez les patients plus jeunes à faible risque. Votre chiffre de est largement hors de propos - la réalité est que les "peurs" sont incroyablement courantes en raison de nombreux facteurs, y compris les préoccupations médico-légales.1 %7 - dix %1 %
Donc, recalculant et très important, pour les jeunes femmes sans facteurs de risque :
p ( C| +)= p ( + | C)p ( + )∗ p ( C) =
= p ( + | C)p ( + |C)∗p ( C)+p ( + | C¯)∗p ( C¯)∗ p ( C) = 0,80,8 ∗ 0,015+0,07 ∗ 0,985∗0,015 = 0,148 .
La probabilité d'avoir un cancer lorsqu'une mammographie de dépistage a été lue comme positive peut être aussi faible que chez les jeunes femmes à faible risque. Soit dit en passant, les lectures mammographiques sont accompagnées d'une estimation indirecte de la confiance dans le diagnostic du radiologue (il s'appelle BI-RADS), et cette analyse bayésienne changerait radicalement à mesure que nous progressons d'un BI-RADS 3 à un BI-RADS 5 - tous des tests «positifs» au sens large.15 %
Ce chiffre peut logiquement être modifié en fonction des estimations que vous considérez dans votre calcul, mais la vérité est que les recommandations concernant l'âge de départ pour entrer dans un programme de mammographie de dépistage ont récemment été repoussées de à4045 .
Chez les femmes âgées, la prévalence (et donc la probabilité du prétest) augmente linéairement avec l'âge. Selon le rapport actuel, le risque qu'une femme soit diagnostiquée d'un cancer du sein au cours des 10 prochaines années , à partir des âges suivants, est le suivant:
Age 30 . . . . . . 0.44 percent (or 1 in 227)
Age 40 . . . . . . 1.47 percent (or 1 in 68)
Age 50 . . . . . . 2.38 percent (or 1 in 42)
Age 60 . . . . . . 3.56 percent (or 1 in 28)
Age 70 . . . . . . 3.82 percent (or 1 in 26)
Il en résulte un risque cumulatif à vie d'environ :10 %
Le calcul chez les femmes âgées avec une prévalence de serait:4 %
p ( C| +)= 0,80,8 ∗ 0,04+0,07 ∗ 0,96∗0,04 = 0,32 ∼ 32 % inférieur à ce que vous avez calculé.
Je ne saurais trop insister sur le nombre de "peurs" qu'il y a même dans les populations plus âgées. En tant que procédure de dépistage, une mammographie est simplement la première étape.Il est donc logique d'interpréter la mammographie positive car il est possible que la patiente souffre d'un cancer du sein, ce qui justifie un examen supplémentaire par échographie, des tests mammographiques supplémentaires (diagnostiques), mammographies de suivi, IRM ou biopsie. Si le était très élevé, nous n'aurions pas affaire à un test de dépistage, ce serait un test de diagnostic , comme une biopsie.p ( C| +)
Réponse spécifique à votre question:
Ce sont les "peurs", le de , et non comme dans le PO, en combinaison avec une prévalence relativement faible de la maladie (faible probabilité de prétest ou élevée ) en particulier chez les femmes plus jeunes, ce qui explique cette probabilité post-test plus faible à travers les âges. p ( + | C¯)7 - dix %1 %p ( C¯)Notez que ce "taux de fausses alertes" est multiplié par la proportion beaucoup plus importante de cas sans cancer (par rapport aux patients atteints de cancer) dans le dénominateur, et non par "la minuscule chance de 1% d'un faux positif dans 1% de la population" que vous mention. Je pense que c'est la réponse à votre question. Pour souligner, bien que cela soit inacceptable dans un test de diagnostic, cela vaut toujours la peine dans une procédure de dépistage.
Problème d' intuition: @Juho Kokkala a soulevé le problème que l'OP posait à propos de l' intuition . Je pensais que cela était impliqué dans les calculs et les derniers paragraphes, mais assez juste ... C'est ainsi que je l'expliquerais à un ami ... Imaginons que nous partions à la recherche de fragments de météores avec un détecteur de métaux à Winslow, en Arizona. Ici:
Image de meteorcrater.com
... et le détecteur de métaux se déclenche. Eh bien, si vous avez dit que les chances sont que c'est à partir d'une pièce de monnaie qu'un touriste a déposé, vous auriez probablement raison. Mais vous obtenez l'essentiel: si l'endroit n'avait pas été filtré de manière aussi approfondie, il serait beaucoup plus probable qu'un bip du détecteur sur un endroit comme celui-ci provienne d'un fragment de météore que si nous étions dans les rues de New York.
Ce que nous faisons avec la mammographie va à une population en bonne santé, à la recherche d'une maladie silencieuse qui, si elle n'est pas détectée tôt, peut être mortelle. Heureusement, la prévalence (bien que très élevée par rapport à d'autres cancers moins guérissables) est suffisamment faible pour que la probabilité de rencontrer au hasard un cancer soit faible, même si les résultats sont "positifs" , et en particulier chez les jeunes femmes.
En revanche, s'il n'y avait pas de faux positifs, c'est-à-dire ( ,p ( C¯| +)=0
p ( + | C)p ( + | C)∗p ( C)+p ( + | C¯)∗p ( C¯)∗ p ( C) = p ( + | C)p ( + | C)∗p ( C)∗ p ( C) = 1 , autant que la probabilité d'avoir touché un fragment de météore si notre détecteur de métaux s'éteignait serait indépendant de la zone que nous explorions si, au lieu d'un détecteur de métaux ordinaire, nous utilisions un instrument parfaitement précis pour détecter les acides aminés de l'espace extra-atmosphérique dans le météore fragment (exemple inventé). Il serait encore plus probable de trouver un fragment dans le désert de l'Arizona qu'à New York, mais si le détecteur émettait un bip, nous saurions que nous avions trouvé un météore.100 %
Comme nous n'avons jamais un appareil ou un système de mesure parfaitement précis, la fraction sera , et plus il est imparfait, moins il sera la fraction du , ou antérieure , qui sera "transmise" à la LHS de l'équation en tant que postérieure . Si nous nous installons sur un type particulier de détecteur, la fraction de vraisemblance agira comme constante dans une équation linéaire de la forme, , oùprobabilitép inconditionnel (+)= p ( + | C)p ( + | C)∗p ( C)+p ( + | C¯)∗p ( C¯)< 1p ( C)postérieur = α ∗ avantpostérieur < avant, et plus le antérieur est petit, plus le postérieur sera linéaire. C'est ce que l'on appelle la dépendance à l'égard de la prévalence de la valeur prédictive positive (VPP) : probabilité que les sujets avec un test de dépistage positif aient réellement la maladie.