Quelle est l'intuition derrière la formule de probabilité conditionnelle?


30

La formule de la probabilité conditionnelle d' A happening étant donné que B est arrivé est la suivante :

P(A | B)=P(AB)P(B).

Mon manuel explique l'intuition derrière cela en termes de diagramme de Venn.

entrez la description de l'image ici

Étant donné que B s'est produit, la seule façon pour A de se produire est que l'événement tombe à l'intersection de A et B .

Dans ce cas, la probabilité de P(A|B) être simplement égal à la probabilité d'A intersectionB , puisque c'est la seule façon pour que l'événement se produise? Qu'est-ce que je rate?


7
Avez-vous une compréhension intuitive de ce qu'est une probabilité conditionnelle, si nous oublions un instant comment la calculer?
Juho Kokkala

4
En conditionnant sur B (l'événement qui s'est produit), vous limitez votre espace de résultats de (tout le plan) à B uniquement. Vous oubliez tout ce qui est en dehors de B. La probabilité de l'événement A doit être mesurée par rapport à B, car la probabilité est comprise entre 0 et 1.Ω
Vladislavs Dovgalecs

1
Vous manquez le fait que la partie blanche du cercle de l'événement A ne fait plus partie de la population une fois que vous savez que l'événement B s'est produit.
Monty Harder

4
Les intuitions ne sont pas exactes, ni singulières, alors pourquoi s'enquérir de l'intuition exacte (singulière)? Une intuition utile suffit, mais toutes les suggestions ne seront pas utiles à tous.
John Coleman

Réponses:


23

Une bonne intuition est donnée que B s'est produit - avec ou sans A - quelle est la probabilité de A? C'est-à-dire que nous sommes maintenant dans l'univers dans lequel B s'est produit - le cercle complet droit. Dans ce cercle, la probabilité de A est l'aire de A intersectant B divisée par l'aire du cercle.


5
En d'autres termes - je vous dis que s'est produit, ce qui signifie que nous vivons dans le cercle B. Dans ce monde, quel% des événements sont dans la lentille ( A B )? BBUNEB
MichaelChirico

18

Je penserais comme ça: je prends pour acquis que vous comprenez l'intuition jusqu'à:

Étant donné que B s'est produit, la seule façon pour que A se produise est que le pair tombe à l'intersection de A et B.

et je vais commenter la deuxième image que vous avez postée:

  1. Imaginez que tout le rectangle blanc soit votre espace d'échantillonnage Ω .

    Attribuer une probabilité à un ensemble signifie que vous mesurez dans un certain sens cet ensemble. C'est la même chose que si vous avez mesuré l'aire du rectangle mais la probabilité est un autre type de mesure qui a des propriétés spécifiques (je ne dirai rien de plus à ce sujet).

  2. Vous savez que et cela est interprété comme ceci:P(Ω)=1

    représente tous les événements qui pourraient se produire et quelque chose doit se produire, nous avons donc une probabilité de 100% que quelque chose se produise.Ω

  3. De façon analogue, l'ensemble a une probabilité P ( A ) qui est proportionnelle à la probabilité de l'espace d'échantillonnage Ω . Graphiquement parlant, vous voyez que A Ω donc la mesure de A (sa probabilité P ( A ) ) doit être inférieure à P ( Ω ) . Le même raisonnement est valable pour l'ensemble A B . Cet ensemble peut être mesuré et sa mesure est P ( A B ) .AP(A)ΩAΩUNEP(UNE)P(Ω)UNEBP(UNEB)

  4. Si maintenant on vous dit que est arrivé, vous devez penser comme si B était votre "nouveau" Ω . Si B est votre "nouveau" Ω, vous pouvez être sûr à 100% que tout se passe dans l'ensemble BBBΩBΩB .

    Et qu'est ce que ca veut dire? Cela signifie que maintenant, dans le "nouveau" concours , et vous devez redimensionner toutes les mesures de probabilité, en tenant compte du fait qu'elles doivent être exprimées en termes de "nouvel" espace d'échantillon BP(BB)=1B . C'est une simple proportion.

    Votre intuition a presque raison lorsque vous dites que:

la probabilité de P (A | B) serait simplement égale à la probabilité de A intersection B

et le "presque" est dû au fait que maintenant votre espace d'échantillonnage a changé (c'est maintenant) et que vous voulez redimensionner P ( A B ) en conséquence.BP(UNEB)

  1. est votre P ( A B ) dans le nouveau monde où l'espace d'échantillonnage est maintenant BP(UNEB)P(UNEB)B . En mots, vous le diriez comme ceci (et essayez de le visualiser sur l'image avec les décors):

    Dans le nouveau monde, le rapport entre la mesure de et la mesure de A B doit être le même que le rapport entre la mesure de Ω et la mesure de A BBUNEBΩUNEB

  2. Traduisez enfin ceci en langage mathématique (une simple proportion):

P(B):P(UNEB)=P(Ω):P(UNEB)

et puisque il s'ensuit que:P(Ω)=1

P(AB)=P(AB):P(B)

5

Vous verrez l'intuition penser facilement au problème suivant.

Supposons que vous ayez 10 balles: 6 noires et 4 rouges. Des boules noires 3 sont impressionnantes et des boules rouges seulement 1 est impressionnante. Quelle est la probabilité qu'une balle noire soit également géniale?

La réponse est très simple: c'est 50%, car nous avons 3 boules noires impressionnantes sur un total de 6 boules noires.

Voici comment mapper les probabilités à notre problème:

  • 3 boules noires ET impressionnantes correspondent à P(UNEB)
  • 6 boules noires correspondent à P(B)
  • probabilité qu'une balle soit impressionnante quand on SAIT qu'elle est noire: P(UNEB)

1
Ne serait-il pas plus logique d'écrire plutôt que P ( B ) = 6 ? n(B)=6P(B)=6
Silverfish

@Silverfish Ce serait plus précis, mais je recherchais l'intuition dans ce cas
Aksakal

4

Pour une intuition de base de la formule de probabilité conditionnelle, j'aime toujours utiliser une table bidirectionnelle. Disons qu'il y a 150 étudiants dans un groupe d'âge, dont 80 femmes et 70 hommes, chacun devant suivre exactement un cours de langue. Le tableau bidirectionnel des étudiants suivant différents cours est le suivant:

        | French   German   Italian  | Total
-------- --------------------------- -------
Male    |     30       20        20  |    70
Female  |     25       15        40  |    80
-------- --------------------------- -------
Total   |     55       35        60  |   150

Étant donné qu'un étudiant suit le cours d'italien, quelle est la probabilité qu'il soit une femme? Eh bien, le cours d'italien compte 60 étudiants, dont 40 femmes qui étudient l'italien, donc la probabilité doit être:

P(F|Italian)=n(FItalian)n(Italian)=4060=23

est la cardinalité de l'ensemble A , c'est-à-dire le nombre d'éléments qu'il contient. Notez que nous devions utiliser n ( F italien ) dans le numérateur et pas seulement n ( F )n(A)An(FItalian)n(F) , car ce dernier aurait inclus les 80 femmes, y compris les 40 autres qui n'étudient pas l'italien.

Mais si la question était inversée, quelle est la probabilité qu'un étudiant suive le cours d'italien, étant donné qu'il s'agit de femmes? Ensuite, 40 des 80 étudiantes suivent le cours d'italien, nous avons donc:

P(Italian|F)=n(ItalianF)n(F)=4080=12

J'espère que cela fournit une intuition pour savoir pourquoi

P(A|B)=n(AB)n(B)

Comprendre pourquoi la fraction peut être écrite avec des probabilités au lieu de cardinalités est une question de fractions équivalentes . Par exemple, revenons à la probabilité qu'un élève soit une femme étant donné qu'il étudie l'italien. Il y a au total 150 étudiants, donc la probabilité qu'un étudiant soit une femme et étudie l'italien soit 40/150 (c'est une probabilité "conjointe") et la probabilité qu'un étudiant étudie l'italien soit 60/150 (c'est une probabilité "marginale" ). Notez que la division de la probabilité conjointe par la probabilité marginale donne:

P(FItalian)P(Italian)=40/15060/150=4060=n(FItalian)n(Italian)=P(F|Italian)

(Pour voir que les fractions sont équivalentes, la multiplication du numérateur et du dénominateur par 150 supprime le "/ 150" dans chacun.)

Plus généralement, si votre espace d'échantillonnage a une cardinalité n ( Ω ) - dans cet exemple, la cardinalité était 150 - nous constatons queΩn(Ω)

P(A|B)=n(AB)n(B)=n(AB)/n(Ω)n(B)/n(Ω)=P(AB)P(B)

3

Je renverserais la logique. La probabilité que et B soit:AB

  1. La probabilite produite, et cela étant donné que A s'est produit.BA
  2. Rôles identiques mais inverses pour A et B

Cela vous donnera

p(AB)=p(B)p(AB)

Si vous cherchez un négatif à votre suggestion, c'est bien qu'il soit vrai que la probabilité de donné B est contenue dans la probabilité du produit, l'espace dans lequel vous lancez les dés est plus petit que votre espace de probabilité d'origine - vous savez à coup sûr, vous êtes "dans" B , donc vous divisez par la taille du nouvel espace.ABB


2

Le diagramme de Venn ne représente pas la probabilité, il représente la mesure des sous-ensembles de l'espace des événements. Une probabilité est le rapport entre deux mesures; la probabilité de X est la taille de "tout ce qui constitue X" divisée par la taille de "tous les événements considérés". Chaque fois que vous calculez une probabilité, vous avez besoin à la fois d'un "espace de réussite" et d'un "espace de population". Vous ne pouvez pas calculer une probabilité basée uniquement sur «la taille» de l'espace de réussite. Par exemple, la probabilité de lancer un sept avec deux dés est le nombre de façons de lancer un sept divisé par le nombre total de façons de lancer deux dés. Il ne suffit pas de connaître le nombre de façons de lancer un sept pour calculer la probabilité. P (A | B) est le rapport de la mesure du "se produisent à la fois A et B" l'espace et la mesure de l'espace "B arrive". Voilà ce que le "|" signifie: cela signifie "faire ce qui vient après cela l'espace de la population".


2

Je pense que la meilleure façon d'y penser est de tracer des chemins pas à pas.

Décrivons l'événement B comme un sur un dé juste - cela peut facilement être démontré qu'il a une probabilité 14 . Décrivons maintenant l'événement A comme le tirage d'un as dans un jeu de cartes standard de 52 cartes - cela peut facilement être démontré qu'il a une probabilité116 .113

Lançons maintenant une expérience où nous lançons un dé, puis choisissons une carte. Donc serait la probabilité que nous tirions un As, étant donné que nous avons déjà obtenu un 4 . Si vous regardez l'image, ce serait le 1P(A|B)416113

411312134. By law of multiplication, our total space is then (16×113)+(16×1213).

Now what's the probability we drew an Ace, GIVEN that we rolled a 4? The answer by using the path is (16×113), which we then need to divide by the total space. So we get

P(A|B)=16×113(16×113)+(16×1213).

enter image description here


2
I was wondering what the downvote was for, because probability trees can be very instructive. Perhaps the concern is that using independent events for the illustration misses the very point of conditional probability, which is that the probability distribution can change depending on the conditioning event. Using a less-superficial illustration may help.
whuber

1

Pensez-y en termes de nombre. La probabilité marginale est le nombre de fois où A s'est produit divisé par la taille de l'échantillon. La probabilité conjointe de A et B est le nombre de fois où A s'est produit avec B divisé par la taille de l'échantillon. La probabilité conditionnelle de A pour un B donné est le nombre de fois où A s'est produit avec B divisé par le nombre de fois où B s'est produit, c'est-à-dire uniquement les A "à l'intérieur" des B.

Vous pouvez trouver une belle illustration visuelle sur ce blog , qui le montre à l'aide de blocs Lego.


1

Au moment de la rédaction, il y a environ 10 réponses qui semblent manquer le point le plus important: vous avez essentiellement raison.

Dans ce cas, la probabilité de P (A | B) ne serait-elle pas simplement égale à la probabilité de A intersection B, puisque c'est la seule façon dont l'événement pourrait se produire?

C'est vraiment vrai. Cela explique pourquoi la quantité à définirP(UNE|B) est en fait P(UNEB) redimensionné.

Qu'est-ce que je rate?

Il vous manque que la probabilité que B soit satisfait étant donné que B est satisfait devrait être de 1 car il s'agit d'un événement assez certain, et non P(BB)=P(B) qui peut bien être inférieur à 1. Diviser par P(B) makes the conditional probability of B given B equal to 1, as expected. Actually this is even better and makes the map AP(A|B) a probability – so a conditional probability is actually a probability.


0

Je pense que c'est plus intuitif lorsque nous avons des données concrètes pour estimer les probabilités.

Prenons l' mtcarsexemple des données, les données ressemblent à ceci (nous utilisons uniquement le nombre de cylindres et le type de transmission.)

> mtcars[,c("am","cyl")]
                    am cyl
Mazda RX4            1   6
Mazda RX4 Wag        1   6
Datsun 710           1   4
Hornet 4 Drive       0   6
...  
...
Ford Pantera L       1   8
Ferrari Dino         1   6
Maserati Bora        1   8
Volvo 142E           1   4

Nous pouvons calculer la distribution conjointe sur deux variables en faisant un tableau croisé:

> prop.table(table(mtcars$cyl,mtcars$am))

          0       1
  4 0.09375 0.25000
  6 0.12500 0.09375
  8 0.37500 0.06250

La probabilité conjointe signifie que nous voulons considérer deux variables en même temps. Par exemple, nous demanderons combien de voitures sont à 4 cylindres et à transmission manuelle.

Maintenant, nous arrivons à la probabilité conditionnelle. J'ai trouvé que la façon la plus intuitive d'expliquer la probabilité conditionnelle est d'utiliser le terme filtrage sur les données.

Supposons que nous voulons obtenir P(unem=1|cyl=4), we will do following estimations:

> cyl_4_cars=subset(mtcars, cyl==4)
> prop.table(table(cyl_4_cars$am))

        0         1 
0.2727273 0.7272727 

This means, we only care cars have 4 cylinder. So we filter data on that. After filtering, we check how many of them are manual transmission.

You can compare conditional this with joint I mentioned earlier to feel the differences.


0

Si Aétait un sur-ensemble de Bla probabilité que Acela se produise, c'est toujours 1 étant donné que Bcela s'est produit, c'est-à-dire P(A|B) = 1. Cependant, Belle-même peut avoir une probabilité bien inférieure à 1.

Prenons l'exemple suivant:

  • donné xest un nombre naturel dans 1..100,
  • Aest ' xest un nombre pair'
  • Best ' xest divisible par 10'

on a alors:

  • P(A) est 0,5
  • P(B) est 0,1

Si nous savons que xc'est divisible par 10 (c'est x-à- dire est Bdedans) nous savons que c'est aussi un nombre pair (c'est x-à- dire est dedans A) ainsi P(A|B) = 1.

De la règle de Bayes, nous avons:

P(UNE|B)=P(UNEB)P(B)

notez que dans notre cas (spécial) P(UNEB), c'est-à-dire que la probabilité qui xest à la fois un nombre pair et un nombre divisible par 10 est égale à la probabilité qui xest un nombre divisible par 10. Nous avons doncP(UNEB)=P(B) et brancher ce retour dans la règle de Bayes, nous obtenons P(UNE|B)=P(B)/P(B)=1.


Pour un exemple non dégénéré, considérons par exemple Aest « xest divisible par 7» et Best « xest divisible par 3». Ensuite , P(A|B)équivaut à «étant donné que nous savons que xest divisible par 3 quelle est la probabilité qu'il est (aussi) divisible par 7?. Ou de manière équivalente «Quelle fraction des nombres 3, 6, ..., 99 sont divisibles par 7»?


0

I think your initial statement may be a misunderstanding.

You wrote:

The formula for conditional probability of A happening, once B has happened is:

From your phrasing, it may sound as if there are 2 events "First B happened, and then we want to calculate the probability that A will happen".

This is not the case. (The following is valid whether there was a misunderstanding or not).

We have just 1 event, which is described by one of 4 possibilities:

  1. neither A nor B;

  2. just A, not B;

  3. just B, not A;

  4. both A and B.

Putting some example numbers on it, let's say

P(A)=0.5,P(B)=0.5,andA and B are independent.

It follows that

P(A and B)=0.25andP(neither A nor B)=0.25.

Initially (with no knowledge of the event), we knew P(AB)=0.25.

But once we know that B has happened, we are in a different space. P(AB) is half of P(B) so the probability of A given B, P(A|B), is 0.5. It is not 0.25, knowing that B has happened.


0

La probabilité de conditionnement N'EST PAS égale à la probabilité d'intersection. Voici une réponse intuitive:

1) P(BUNE): "Nous savons que UNEarrivé. Quelle est la probabilité queB qui va se passer?"

2: P(UNEB) : "Nous ne savons pas si UNE ou Best arrivé. Quelle est la probabilité que les deux se produisent?

La différence est que dans le premier, nous avons des informations supplémentaires (nous savons que UNEse produit en premier). Dans le second, nous ne savons rien.

En partant de la probabilité du second, on peut en déduire la probabilité du premier.

L'événement que les deux UNE et B se produira peut se produire de deux manières:

1) La probabilité de UNE ET la probabilité de B étant donné que UNE arrivé.

2) La probabilité de B ET la probabilité de UNE étant donné que B arrivé.

Il s'avère que les deux situations sont également similaires à se produire. (Je ne peux pas moi-même découvrir la raison intuitive). Nous devons donc pondérer les deux scénarios avec0,5

P(UNEB)=1/2P(UNE(BUNE))+1/2P(B(UNEB))

Maintenant, utilisez ça UNE et BUNE sont indépendants et n'oubliez pas que les deux scénarios sont également susceptibles de se produire.

P(UNEB)=P(UNE)P(BUNE)

Tadaaa ... maintenant isoler la probabilité du conditionnement!

btw. J'aimerais que quelqu'un explique pourquoi les scénarios 1 et 2 sont égaux. La clé réside là-dedans imo.

En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.