Quelle est la probabilité que cette personne soit une femme?


32

Il y a une personne derrière un rideau - je ne sais pas s'il s'agit d'une femme ou d'un homme.

Je sais que la personne a les cheveux longs et que 90% des personnes ayant les cheveux longs sont des femmes

Je sais que la personne a un groupe sanguin rare AX3 et que 80% de toutes les personnes de ce groupe sanguin sont des femmes.

Quelle est la probabilité que la personne soit une femme?

REMARQUE: cette formulation originale a été complétée par deux autres hypothèses: 1. Le groupe sanguin et la longueur des cheveux sont indépendants. 2. Le ratio homme: femme dans la population générale est de 50:50.

(Le scénario spécifique ici n’est pas aussi pertinent. Au lieu de cela, j’ai un projet urgent qui nécessite de bien comprendre l’approche correcte pour répondre à cette question. J’ai le sentiment que c’est une question de simple probabilité, avec une simple réponse définitive, plutôt que quelque chose avec plusieurs réponses discutables selon différentes théories statistiques))


1
Il n’existe pas de multiples théories de la probabilité, mais il est notoirement vrai que les gens ont de la difficulté à penser correctement aux probabilités. (Augustus DeMorgan, un bon mathématicien, a abandonné l'étude de la probabilité en raison de ses difficultés.) Ne regardez pas les débats: recherchez des appels à des principes de probabilité (tels que les axiomes de Kolmogorov). Ne laissez pas cela être résolu démocratiquement: votre question attire de nombreuses réponses mal conçues qui, même si certaines d’entre elles sont d’accord, sont simplement collectivement fausses. @Michael C donne de bons conseils; ma réponse essaie de vous montrer pourquoi il a raison.
whuber

@Whuber, si l'indépendance est supposée, diriez-vous que 0,97297 est la bonne réponse? (Je pense que la réponse pourrait se situer entre 0% et 100% sans cette hypothèse - vos diagrammes le montrent bien).
Probablement

Indépendance de quoi, précisément? Êtes-vous en train de suggérer que les coiffures féminine et masculine sont les mêmes? Comme vous le dites dans votre question, ce scénario particulier impliquant le sexe / les cheveux / le groupe sanguin peut ne pas être pertinent: cela signifie que vous cherchez à comprendre comment résoudre des problèmes comme celui-ci en général. Pour ce faire, vous devrez savoir quelles hypothèses impliquent quelles conclusions. Par conséquent, vous devez vous concentrer très attentivement sur les hypothèses que vous êtes prêt à formuler et déterminer exactement dans quelle mesure elles vous permettent de conclure.
whuber

3
Le type d'indépendance à explorer concerne la combinaison des trois caractéristiques. Par exemple, si AX3 est un marqueur d'un syndrome qui inclut la calvitie chez les femmes (mais pas chez les hommes), alors toute personne à cheveux longs avec AX3 est nécessairement un homme, ce qui porte la probabilité d'être une femme à 0% et non à 97,3%. J'espère que cela montre à l'évidence que quiconque apporte une réponse définitive à cette question doit émettre des hypothèses supplémentaires, même s'il ne les reconnaît pas explicitement. Les réponses vraiment utiles, à mon humble avis, seraient celles qui montrent directement comment différentes hypothèses conduisent à des résultats différents.
whuber

2
Vous manquez la probabilité qu'une femme n'ait pas les cheveux longs. C'est une mesure critique.
Daniel R Hicks

Réponses:


35

De nombreuses personnes trouvent utile de penser en termes de "population", de sous-groupes et de proportions (plutôt que de probabilités). Cela se prête au raisonnement visuel.

J'expliquerai les chiffres en détail, mais l'objectif est qu'une comparaison rapide des deux chiffres indique immédiatement et de manière convaincante comment et pourquoi aucune réponse spécifique à la question ne peut être donnée. Un examen un peu plus long suggérera quelles informations supplémentaires seraient utiles pour déterminer une réponse ou au moins pour obtenir des limites sur les réponses.

Diagramme de Venn

Légende

Hachures croisées : femme / Fond plein : homme.

En haut : poils longs / En bas : poils courts.

Droite (et colorée) : AX3 / Gauche (non colorée) : non-AX3.

Les données

Le quadrillage supérieur correspond à 90% du rectangle supérieur ("90% des personnes ayant les cheveux longs sont des femmes").

Les hachures totales dans le rectangle de couleur de droite représentent 80% de ce rectangle ("80% des personnes de ce groupe sanguin sont des femmes").

Explication

Ce diagramme montre de manière schématique comment la population (de toutes les femmes et des non-femmes considérées) peut être simultanément divisée en femmes / non-femmes, AX3 / non-AX3 et cheveux longs / non longs. Il utilise la surface, au moins approximativement, pour représenter les proportions (il y a une exagération pour rendre la photo plus claire).

Il est évident que ces trois classifications binaires créent huit groupes possibles. Chaque groupe apparaît ici.

Les informations fournies indiquent que le rectangle supérieur hachuré (femelles aux cheveux longs) comprend 90% du rectangle supérieur (toutes les personnes aux cheveux longs). Il indique également que les parties hachurées combinées des rectangles colorés (les femelles aux cheveux longs avec AX3 et les femelles aux cheveux courts avec AX3) représentent 80% de la région colorée à droite (toutes les personnes atteintes de AX3). On nous dit que quelqu'un se trouve dans le coin supérieur droit (flèche): les personnes aux cheveux longs avec AX3. Quelle proportion de ce rectangle est hachurée (femelle)?

J'ai également supposé (implicitement) que le groupe sanguin et la longueur des cheveux sont indépendants : la proportion du rectangle supérieur (cheveux longs) qui est colorée (AX3) est égale à la proportion du rectangle inférieur (cheveux courts) qui est colorée (AX3). C'est ce que signifie l'indépendance. C'est une hypothèse juste et naturelle à faire lorsque l'on aborde de telles questions, mais il faut bien sûr le préciser.

La position du rectangle quadrillé supérieur (femelles aux cheveux longs) est inconnue. Nous pouvons imaginer faire glisser le rectangle hachuré supérieur d'un côté à l'autre et le rectangle hachuré inférieur d'un côté à l'autre et éventuellement en modifier la largeur. Si nous faisons cela pour que 80% du rectangle coloré reste hachuré, une telle modification ne changera en rien l'information indiquée, mais cela pourrait modifier la proportion de femmes dans le rectangle supérieur droit. À l’évidence, cette proportion pourrait se situer entre 0% et 100% tout en restant cohérente avec l’information donnée, comme dans cette image:

Figure 2


L'un des points forts de cette méthode est qu'elle établit l'existence de réponses multiples à la question. On pourrait traduire tout cela algébriquement et, au moyen de stipulations de probabilités, proposer des situations spécifiques comme exemples possibles, mais la question se poserait alors de savoir si de tels exemples sont vraiment cohérents avec les données. Par exemple, si quelqu'un suggère que AX3 représente peut-être 50% des personnes aux cheveux longs, il n'est pas évident au départ que cela soit même possible compte tenu de toutes les informations disponibles. Ces diagrammes (Venn) de la population et de ses sous-groupes rendent ces choses claires.


3
Whuber, en supposant que le groupe sanguin et la longueur des cheveux soient indépendants, alors la portion des femmes aux cheveux longs de type AX3 devrait être identique à celle des femmes aux cheveux courts de AX3? C'est-à-dire que vous n'avez pas la possibilité de changer les rectangles de la manière que vous proposez ... Si nous supposons également que les hommes et les femmes sont 50:50 dans la population entière, cela ne nous donne-t-il pas assez d'informations pour résoudre cette question avec un seul réponse indiscutable?
Probablement

@whuber +1 très sympa.
Michael R. Chernick

5
Probablement bon, examinez de près la question dans votre commentaire: comme il s’agit de femmes , il suppose une hypothèse supplémentaire sur l’indépendance, conditionnée par le sexe. L'hypothèse d'une indépendance (inconditionnelle) des cheveux et du groupe sanguin ne mentionne pas du tout le sexe, alors pour comprendre ce que cela signifie, effacez la hachure des chiffres. J'espère que cela indique pourquoi nous avons la possibilité de situer la hachure croisée où bon nous semble dans les rectangles supérieur et inférieur.
whuber

1
@ Whuber, j'aime ça. Cependant, j'ai deux questions / clarifications: 1. les chiffres semblent supposer des proportions de population pour les cheveux longs vs courts (environ 6: 4) & ~ AX3 vs AX3 (environ 85:15), mais cela n'est pas mentionné dans la question initiale ni discuté dans vos explications des chiffres. Je soupçonne que les proportions de pop ne sont pas pertinentes. Ai-je raison / pourriez-vous préciser cela dans les explications? 2. Je pense que cette situation fonctionne finalement avec le même phénomène que le paradoxe de Simpson , mais que son libellé est différent (pour ainsi dire, le problème vient de l’autre). Est-ce une évaluation juste?
gung - Réintégrer Monica

3
@gung, merci d'avoir apporté ces précisions. Les chiffres doivent bien sûr représenter certaines proportions pour fonctionner, mais toute proportion non spécifiquement définie dans l’énoncé du problème est libre de varier. (J'ai construit la figure de manière à ce qu'environ 50% de la population apparaisse comme une femme, en prévision d'un montage ultérieur dans lequel cela a été supposé.) L'idée d'appliquer cette représentation graphique à la compréhension du paradoxe de Simpson est intrigante; Je pense que cela a du mérite.
whuber

13

     A={'The person has long hair'}              B={'The person has blood type Ax3'}C={'The person is female'}.

P(C|A and B)P(C|A)=0.9P(C|B)=0.8
P(C|A and B)P(A and B and C)=0.7
P(C|A and B)=P(A and B and C)/P(A and B)=0.7/P(A and B).
P(A and B)=0.8P(C|A and B)=0.875P(A and B)=0.9P(C|A and B)

P(C|A)=0.9P(C|B)=0.8P(C|A and B)


Bonjour Michael, si je vous ai bien lu, vous dites qu'il est impossible de répondre à la question posée, n'est-ce pas? Ou pour le dire autrement, vous auriez besoin de plus d'informations pour répondre à cette question? 1. Supposons que le groupe sanguin rare dans ma question initiale n'a aucun impact sur le désir ou la capacité d'une personne à faire pousser ses cheveux longs. Peut-on maintenant répondre à la question? 2. Seriez-vous d'accord pour dire que la réponse doit être supérieure à 0,9? (Parce que vous avez une deuxième information indépendante - le groupe sanguin - qui renforce l'hypothèse selon laquelle la personne est une femme)
ProbablementWrong

2
P(A and B)P(A and B)=P(A)P(B)P(A)P(B)P(C|A and B)>0.9

2
@ Probablement Bien. Oui, le problème énoncé initialement ne dispose pas d'informations suffisantes pour une réponse unique.
Michael R. Chernick

@ Néstor, Micahael, je suis en désaccord sur le fait que nous devons savoir quelle fraction de personnes a les cheveux longs ou quelle fraction de personne a le groupe sanguin AX3. Je pense que la réponse à la question initiale est résolue de manière unique sans le savoir (en supposant que A et B sont indépendants, ce que nous avons tous, et en supposant que nous connaissions la division des hommes et des femmes dans la population entière - ce qui n’est pas déraisonnable de supposer qu’il s’agit d’environ 50:50 , Je pense).
Probablement

7
P(C|A and B)=P(A and B and C)×P(A and B)??
P(C|AB)=P(C(AB))P(AB)=P(ABC)P(AB)

4

Discussion fascinante! Je me demande si nous avons également spécifié P (A) et P (B) si les plages de P (C | A, B) ne seront pas beaucoup plus étroites que l'intervalle complet [0,1], simplement en raison des nombreuses contraintes on a.

S'en tenir à la notation introduite ci-dessus:

A = l'événement que la personne a les cheveux longs

B = l'événement où la personne a un groupe sanguin AX3

C = l'événement auquel cette personne est une femme

P (C | A) = 0,9

P (C | B) = 0,8

P (C) = 0,5 (supposons un ratio égal d'hommes et de femmes dans la population)

P(AB|C)=P(A|C)P(B|C)=P(C|A)P(A)P(C)P(C|B)P(B)P(C)

puis

P(C|AB)=P(AB|C)(P(C)P(AB))=P(C|A)P(A)P(C)P(C|B)P(B)P(C)(P(C)P(AB))

P(AB)=P(A)P(B)

P(C|AB)=P(C|A)P(C|B)P(C)=0.90.80.5>1

P(C|AB)[0,1]P(A)P(B)P(A)P(B)

P(C|AB)

P(C|A)=0.9

P(C)=0.5

P(C|B)=0.8

4. (trivial) Le rectangle supérieur ne peut pas être déplacé au-delà de la limite gauche et ne doit pas être déplacé au-delà de son chevauchement minimal à gauche.

5. (trivial) Le rectangle inférieur ne peut pas être déplacé au-delà de la limite droite et ne doit pas être déplacé au-delà de son chevauchement maximal à droite.

P(C|AB)entrez la description de l'image ici

Ce graphique permet de parcourir une plage de valeurs possibles pour P (A) et P (B) ( script R ). entrez la description de l'image ici

En conclusion, nous pouvons réduire la probabilité conditionnelle P (c | A, B) pour P (A), P (B) donné


2
A,B,C

1
@whuber: merci pour le commentaire utile! J'espère que les nouvelles modifications le rendront plus lisible et plus clair.
Markus Loecher le

@ Whuber et d'autres: J'avais espéré relancer la discussion mais le fil semble être devenu inactif? Pas plus de commentaires de quelqu'un?
Markus Loecher

1

Faire l'hypothèse est que la personne derrière un rideau est une femme.

Nous avons donné 2 éléments de preuve, à savoir:

Preuve 1: Nous savons que la personne a les cheveux longs (et on nous dit que 90% des personnes ayant les cheveux longs sont des femmes)

Preuve 2: Nous savons que la personne a un groupe sanguin rare AX3 (et on nous dit que 80% de toutes les personnes de ce groupe sanguin sont des femmes)

À partir de la première preuve 1, nous pouvons affirmer que la personne derrière un rideau a une probabilité de 0,9 d’être une femme (en supposant une répartition 50:50 entre hommes et femmes).

En ce qui concerne la question posée précédemment dans le fil, à savoir "Seriez-vous d'accord pour dire que la réponse doit être supérieure à 0,9?", Sans faire de calcul, je dirais intuitivement que la réponse doit être "oui" (supérieure à 0,9). La logique est que Evidence 2 est une preuve à l'appui (encore une fois, en supposant un partage 50:50 pour le nombre d'hommes et de femmes dans le monde). Si on nous disait que 50% de toutes les personnes atteintes du sang de type AX3 étaient des femmes, alors la preuve 2 serait neutre et n'aurait pas d'incidence. Mais comme on nous dit que 80% de toutes les personnes de ce groupe sanguin sont des femmes, Evidence 2 apporte des preuves à l'appui et devrait logiquement augmenter la probabilité finale qu'une femme soit au-dessus de 0,9.

Pour calculer une probabilité spécifique, nous pouvons appliquer la règle de Bayes pour la preuve 1, puis utiliser la mise à jour bayésienne pour appliquer la preuve 2 à la nouvelle hypothèse.

Supposer:

A = l'événement que la personne a les cheveux longs

B = l'événement où la personne a un groupe sanguin AX3

C = l'événement où cette personne est une femme (supposons 50%)

Application de la règle de Bayes à la preuve 1:

P (C | A) = (P (A | C) * P (C)) / P (A)

Dans ce cas, encore une fois si nous supposons une répartition 50:50 entre hommes et femmes:

P (A) = (0,5 * 0,9) + (0,5 * 0,1) = 0,5

Donc, P (C | A) = (0.9 * 0.5) / 0.5 = 0.9 (Pas étonnant, mais ce serait différent si nous n'avions pas de partage 50:50 entre hommes et femmes)

En utilisant la mise à jour bayésienne pour appliquer Evidence 2 et en connectant la 0.9 à la nouvelle probabilité antérieure, nous avons:

P (C | A ET B) = (P (B | C) * 0,9) / P (E)

Ici, P (E) est la probabilité de preuve 2, étant donné l’hypothèse que la personne a déjà 90% de chances d’être une femme.

P (E) = (0.9 * 0.8) + (0.1 * 0.2) [loi de probabilité totale: (P (femme) * P (AX3 | femme) + P (homme) * P (AX3 | homme)] Donc , P (E) = 0,74

Donc, P (C | A ET B) = (0,8 * 0,9) / 0,74 = 0,97297


1
Votre réponse contient quelques affirmations qui n’ont aucun sens pour moi. (1) P (C | A) = 0,9 par hypothèse. Nulle part il n'a été dit que P (C) = 0,9. Nous avons supposé P (C) = 0.5. (2) Comment avez-vous obtenu le résultat pour P (E)? P (femme) = P (homme) = 0,5 par hypothèse où vous écrivez P (femme) = 0,9.
Michael R. Chernick

La valeur de P (C) est supposée à 0,5, c'est ce que j'ai utilisé. La valeur de P (E) est la probabilité que l'élément de preuve 2 apparaisse après l'application de l'élément de preuve 1 (ce qui conduit à une nouvelle hypothèse selon laquelle la probabilité que la personne soit une femme est de 0,9). P (E) = (probabilité que la personne soit une femme (selon Evience 1) * probabilité que la personne présente AX3 si une femme est +) (probabilité que la personne est un homme (selon Evience 1) * probabilité que la personne présente AX3 si un homme) = (0.9 * 0.8) + (0.1 * 0.2) = 0.74
RandomAnswer

Votre définition de la probabilité de E est un peu déroutante et les termes que vous utilisez pour le calculer ont une apparence différente de ce que vous avez écrit auparavant. Cela n'a pas d'importance cependant. La réponse est apparemment correcte si l'on se base sur la réponse bien présentée de Huu.
Michael R. Chernick

@Michael Sauf qu'il semble que Huu ait commis des erreurs.
whuber

2
Cette réponse est tout simplement fausse. Il peut y avoir d'autres erreurs, mais celle-ci est flagrante. Vous énoncez une réponse définitive pour P ("a les cheveux longs") (votre P (A)), puis vous l'utilisez pour donner votre réponse définitive. Il n’ya tout simplement pas assez d’informations pour le déterminer, même en supposant que P (F) = 0,5. Votre ligne pour calculer P (A) semble venir de nulle part. Voici la formule correcte en utilisant Bayes theroem: P (A) = P (A | F) P (F) / P (F | A) à partir duquel, en utilisant vos hypothèses énoncées, arriver à P (A) = P (A | F) * 5/9. Cependant, nous ne savons toujours pas P (A | F), qui pourrait être n'importe quoi.
Bogdanovist

0

Restitution des questions et généralisation

ABC01ZiZi(X|Y)XY(Aa|BbCcI)

  1. (Aa1|Bb1I)=u1(Aa2|Cc2I)=u2
  2. (Aa1|Bb1I)=u1(Aa2|Cc2I)=u2(BC|I)=(B|I)(C|I)
  3. (Aa1|Bb1I)=u1(Aa2|Cc2I)=u2(A0|I)=12
  4. (Aa1|Bb1I)=u1(Aa2|Cc2I)=u2(A0|I)=12(BC|I)=(B|I)(C|I)

I

(BjCk|I)=(Bj|I)(Ck|I),j=0,1k=0,1

Réponses

Cas 1

(ABC|I)(ABC|I)

Il a été démontré par divers moyens ésotériques que la distribution à affecter lorsque les informations ne déterminent pas autrement une solution est celle qui, parmi toutes les distributions compatibles avec les informations connues, présente la plus grande entropie. Toute autre distribution implique que nous en sachions plus que les informations connues, ce qui est bien sûr une contradiction.

i,j,k(AiBjCk|I)ln(AiBjCk|I)
i,j,k(AiBjCk|I)=1
(Aa1|Bb1I)=u1i.e.k(Aa1Bb1Ck|I)i,k(AiBb1Ck|I)=u1
(Aa2|Cc2I)=u2i.e.j(Aa2BjCc2|I)i,j(AiBjCc2|I)=u2

  1. A1
  2. B1
  3. C1

a=1b=1c=1a1=1b1=1a2=1c2=1u1=0.9u2=0.8(A1|B1C1I)0.932. Par conséquent, la probabilité que la personne derrière le rideau soit une femme, étant donné qu’elle a les cheveux longs et le groupe sanguin AX3, est de 0,932.

Cas 2

BC

(B0|ClI)=(B0|I),l=0,1
i(AiB0Cl|I)i,j(AiBjCl|I)=i,k(AiB0Ck|I),l=0,1
(A1|B1C1I)0.936

Cas 3

(A0|I)=12i.e.j,k(A0BjCk|I)=12
(A1|B1C1I)0.973

Cas 4

(A1|B1C1I)0.989


-2

Je crois maintenant que, si nous supposons une proportion d'hommes et de femmes dans la population en général, il n'y a alors qu'une seule réponse indiscutable.

A = l'événement que la personne a les cheveux longs

B = l'événement où la personne a un groupe sanguin AX3

C = l'événement auquel cette personne est une femme

P (C | A) = 0,9

P (C | B) = 0,8

P (C) = 0,5 (supposons un ratio égal d'hommes et de femmes dans la population)

Alors P (C | A et B) = [P (C | A) x P (C | B) / P (C)] / [[P (C | A) x P (C | B) / P (C )] + [[1-P (C | A)] x [1-P (C | B)] / [1-P (C)]]

dans ce cas, P (C | A et B) = 0,972973


P [C | A et B) = P (A et B et C) / P (A et B) = P (A et B et C) / [P (A | B) P (B)]. Comment as-tu eu ta formule?
Michael R. Chernick

Il existe probablement un moyen d'ajouter des conditions pour obtenir une réponse unique.
Michael R. Chernick

Pour ajouter par l’indépendance de A et B, la formule se simplifie en P (A et B et C} / [P (A) P (B)] = P (B et C | A) / P (B).
Michael R. Chernick

2
Le but de ma question était vraiment que vous justifiiez la formule. Je ne comprends pas comment cela serait dérivé.
Michael R. Chernick

2
Non, la réponse censée utiliser la règle de Bayes est incorrecte. Je ne sais pas pourquoi vous êtes confus, la formule de MC ci-dessus est correcte et ne peut pas être utilisée pour obtenir un résultat, c'est ce que ses réponses et celles de Whuber à la question ont expliqué!
Bogdanovist

-2

Remarque: pour obtenir une réponse définitive, les réponses ci-dessous supposent que la probabilité qu'une personne, un homme à cheveux longs et une femme à cheveux longs, soit porteur de AX3 soit approximativement la même chose. Si plus de précision est souhaitée, cela doit être vérifié.

Vous commencez avec la connaissance que la personne a les cheveux longs, donc à ce stade, les chances sont:

90:10

Remarque: le rapport entre les hommes et les femmes dans la population générale ne nous importe pas une fois que nous avons découvert que la personne avait les cheveux longs. Par exemple, s'il y avait 1 femme sur 100 dans la population en général, une personne aux cheveux longs sélectionnée au hasard serait toujours une femme 90% du temps. Le rapport femmes / hommes importe! (voir la mise à jour ci-dessous pour plus de détails)

Ensuite, nous apprenons que la personne a AX3. Comme AX3 n’est pas lié aux cheveux longs, on sait que le rapport hommes-femmes est de 50:50, et comme nous supposons que les probabilités sont les mêmes, nous pouvons simplement multiplier chaque côté de la probabilité et normaliser afin que la somme de les côtés de la probabilité est égal à 100:

(90:10) * (80:20)
==> 7200:200

    Normalize by dividing each side by (7200+200)/100 = 74

==> 7200/74:200/74
==> 97.297.. : 2.702..

Ainsi, la probabilité que la personne derrière le rideau soit une femme est d'environ 97,297%.

MISE À JOUR

Voici une exploration plus poussée du problème:

Définitions:

f - number of females
m - number of males
fl - number of females with long hair
ml - number of males with long hair
fx - number of females with AX3
mx - number of males with AX3
flx - number of females with long hair and AX3
mlx - number of males with long hair and AX3
pfl - probability that a female has long hair
pml - probability that a male has long hair
pfx - probability that a female has AX3
pmx - probability that a male has AX3

Premièrement, on nous dit que 90% des personnes aux cheveux longs sont des femmes et que 80% des personnes atteintes d'AX3 sont des femmes, donc:

fl = 9 * ml
pfl = fl / f
pml = ml / m 
    = fl / (9 * m)

fx = 4 * mx
pfx = fx / f
pmx = mx / m 
    = fx / (4 * m)

Parce que nous avons supposé que la probabilité de AX3 était indépendante du sexe et des cheveux longs, notre pfx calculé s'appliquera aux femmes aux cheveux longs, et pmx aux hommes ayant les cheveux longs pour trouver le nombre de ceux qui ont probablement AX3:

flx = fl * pfx 
    = fl * (fx / f) 
    = (fl * fx) / f
mlx = ml * pmx 
    = (fl / 9) * (fx / (4 * m)) 
    = (fl * fx) / (36 * m)

Ainsi, le rapport probable entre le nombre de femmes ayant les cheveux longs et AX3 et le nombre d’hommes ayant les cheveux longs et AX3 est égal à:

flx             :   mlx
(fl * fx) / f   :   (fl * fx) / (36 * m)
1/f             :   1 / (36m)
36m             :   f

Comme il est donné qu'il y a un nombre égal de 50:50, vous pouvez annuler les deux côtés et terminer avec 36 femmes pour chaque homme. Sinon, il y a 36 * m / f femelles pour chaque mâle du sous-groupe spécifié. Par exemple, s'il y avait deux fois plus de femmes que d'hommes, il y aurait 72 femmes pour chaque homme parmi ceux qui ont les cheveux longs et AX3.


1
Cette solution repose sur l'hypothèse de plus que ce qui est actuellement indiqué dans le problème: les cheveux longs, AX3 et le sexe sont indépendants. Sinon, vous ne pouvez pas justifier l'application de pfx aux femmes aux cheveux longs, etc.
whuber

@ Whuber: Oui, je fais cette hypothèse. Cependant, l’objectif de la probabilité de donner la meilleure approximation n’est-il pas basé sur les données dont vous disposez? Ainsi, puisque vous savez déjà que les cheveux longs et AX3 sont indépendants de la population en général, vous DEVRAIT reporter cette hypothèse aux hommes et aux femmes jusqu'à ce que vous en appreniez autrement. Certes, ce n’est pas un problème universel, mais c’est le meilleur choix que vous puissiez faire jusqu’à ce que vous obteniez plus d’informations. Q: Avec les seules données actuelles, si vous deviez donner le% de chances que ce soit une femme derrière le rideau, diriez-vous vraiment "entre 0 et 100%"?
Briguy37

1
Nous avons une différence de philosophie importante, @Briguy. Je crois fermement en ne pas faire des hypothèses sans fondement. On ne sait pas dans quel sens l'hypothèse d'indépendance mutuelle est "la meilleure": je l'accepterai peut-être dans certaines applications. Mais en général, cela me semble dangereux. Je préférerais que les hypothèses nécessaires à la résolution d'un problème soient claires, afin que les gens puissent décider s'il est utile de collecter des données pour vérifier ces hypothèses, plutôt que de supposer des éléments pratiques sur le plan mathématique pour obtenir une réponse. C'est la différence entre les statistiques et les mathématiques.
whuber

Pour répondre à votre question: oui, 0% à 100% est exactement la réponse que je donnerais. (J'ai donné des réponses similaires à des questions comparables sur ce site.) Cet intervalle reflète avec précision l'incertitude. Cette question est étroitement liée au paradoxe d’Ellsberg . L'article original d'Ellsberg est bien écrit et clair: je le recommande.
whuber

@ Whuber: Merci d'avoir pris le temps de dialoguer avec moi. Je comprends ce que vous dites au sujet de l’importance de la réflexion et de la liste des hypothèses retenues, et j’ai mis à jour ma réponse en conséquence. Cependant, en ce qui concerne votre réponse, je pense qu’elle est incomplète. La raison en est que vous pouvez prendre en compte tous les cas inconnus et trouver la probabilité moyenne de tous pour arriver à votre réponse finale. EG Bien que les deux soient encore possibles, les probabilités supérieures à 50% sont beaucoup plus répandues que les probabilités inférieures à 50% dans tous les cas. Nous avons donc tout intérêt à deviner qu'il s'agit d'une femme.
Briguy37

-4

98% de femmes, interpolation simple. Première prémisse 90% de femmes, laisse 10%, deuxième prémisse ne laisse que 2% des 10% existants, donc 98% de femmes

En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.