Probabilité conditionnelle d'une variable continue


12

Supposons que la variable aléatoire suit une distribution uniforme continue avec les paramètres 0 et 10 (c'est-à-dire U U ( 0 , 10 ) )UUU(0,10)

Désignons maintenant A l'événement où = 5 et B l'événement où U est égal à 5 ou 6. Selon ma compréhension, les deux événements ont une probabilité nulle de se produire.UU5

Maintenant, si nous considérons calculer , nous ne pouvons pas utiliser la loi conditionnelle P ( A | B ) = P ( A B )P(A|B) , carP(B)est égal à zéro. Cependant, mon intuition me dit queP(A|B)=1/2.P(A|B)=P(AB)P(B)P(B)P(A|B)=1/2


2
Que vous dirait votre intuition si avait une densité non uniforme de 0,02 u , u ( 0 , 10 ) ? U0.02u,u(0,10)
Dilip Sarwate

1
@DilipSarwate Mon intuition me dirait que la réponse est un nombre légèrement inférieur à 0,5
Noob

Réponses:


9

"Le concept d'une probabilité conditionnelle par rapport à une hypothèse isolée dont la probabilité est égale à 0 est inadmissible." A. Kolmogorov

Pour les variables aléatoires continues, et Y disent, les distributions conditionnelles sont définies par la propriété qu'elles récupèrent la mesure de probabilité d'origine, c'est-à-dire pour tous les ensembles mesurables A B ( X ) , B B ( Y ) , P ( X A , Y B ) = B d P Y ( y ) B d P X | Y ( x |XYAB(X)BB(Y) Cela implique que la densité conditionnelle est définie arbitrairement sur des ensembles de mesure zéro ou, en d'autres termes, que la densité conditionnelle p X | Y ( x | y ) est définipresque partout. Puisque l'ensemble { 5 , 6 } est de mesure zéro par rapport à la mesure de Lebesgue, cela signifie que vous pouvez définir à la fois p ( 5 ) et p ( 6 ) de manière absolument arbitraire et donc que la probabilité P ( U = 5 |

P(XA,YB)=BdPY(y)BdPX|Y(x|y)
pX|Y(x|y){5,6}p(5)p(6) peut prendre n'importe quelle valeur.
P(U=5|U{5,6})

Cela ne signifie pas que vous ne pouvez pas définir une densité conditionnelle par la formule de rapport comme dans le cas normal bivarié mais simplement que la densité n'est définie presque partout que pour les deux x et y .

f(y|x)=f(x,y)/f(x)
xy

"De nombreux arguments assez futiles ont fait rage - entre probabilistes autrement compétents - sur lequel de ces résultats est" correct "." ET Jaynes

Le fait que l'argument limitant (lorsque passe à zéro) dans la réponse ci-dessus semble donner une réponse naturelle et intuitive est lié au paradoxe de Borel . Le choix du paramétrage dans les matières limites, comme le montre l'exemple suivant que j'utilise dans mes cours de premier cycle.ϵ


Prenez la normale bivariée Quelle est la densité conditionnelle de X étant donné que X = Y ?

X,OuiiidN(0,1)
XX=Oui


Si l'on part de la densité conjointe , la réponse "intuitive" est [proportionnelle à] φ ( x ) 2 . Ceci peut être obtenu en considérant le changement de variable ( x , t ) = ( x , y - x ) φ ( x ) φ ( t + x )T = Y - X a la densité φ (φ(X)φ(y)φ(X)2

(X,t)=(X,y-X)φ(X)φ(t+X)
T=Oui-X . Doncf(x|t)= φ ( x ) φ ( t + x )φ(t/2)/2 etf(x|t=0)=φ(x)φ(x)
F(X|t)=φ(X)φ(t+X)φ(t/2)/2
Cependant, si l'on considère plutôt le changement de variable(x,r)=(étant donné queRestf(x|r
F(X|t=0)=φ(X)φ(X)φ(0/2)/2=φ(X)22
la densité marginale de R = Y / X est la densité de Cauchy ψ ( r ) = 1 / π { 1 + r 2 } et la densité conditionnelle de X
(X,r)=(X,y/X)φ(X)φ(rX)|X|
R=Oui/Xψ(r)=1/π{1+r2}XR Par conséquent, f ( x | r = 1 ) = π φ ( x ) 2 | x | / 2
F(X|r)=φ(X)φ(rX)|X|×π{1+r2}
Et là réside le « paradoxe »: les événements R = 1 et T = 0 sont les mêmes que X = Y , mais elles conduisent à différentes densités conditionnelles sur X .
F(X|r=1)=πφ(X)2|X|/2.
R=1T=0X=OuiX

2
Ceci est tout simplement faux. Si vous suivez un cours rigoureux de théorie des probabilités, vous verrez que le conditionnement sur des événements de mesure zéro est possible et pratique. Prenons un gaussien bitivarié. Tout le monde sait que vous pouvez conditionner la première variable à prendre la valeur zéro, bien que cet événement ait une probabilité nulle. Voir wikipedia. en.wikipedia.org/wiki/…
Yair Daon

5

Voici une réponse controversée:

Xi'an a raison de dire que vous ne pouvez pas conditionner des événements avec une probabilité nulle. Cependant, Yair a également raison de dire qu'une fois que vous avez décidé d'un processus limitant , vous pouvez évaluer une probabilité. Le problème est qu'il existe de nombreux processus limitatifs qui arrivent à la condition souhaitée.

(1,11)p1-p

Notez que de nombreux statisticiens n'acceptent pas le principe d'indifférence. Je l'aime parce qu'elle reflète mes intuitions. Bien que je ne sache pas toujours comment l'appliquer, peut-être que dans 50 ans, ce sera plus courant?


[0,dix]5061-25

@whuber: L'argument flipping ne fonctionnerait pas pour une distribution Cauchy, à moins que vous n'ayez inversé son mode.
Neil G

Bien sûr: il existe de nombreuses façons de transformer une distribution continue en une autre qui permute deux valeurs. En fait, votre "retournement" n'a même pas conservé la distribution d'origine. (Cela a complètement changé son support.) Il semblerait donc que tout ce que vous faites est de remplacer une distribution par une autre. Aucun principe ne semble fonctionner ici.
whuber

@whuber: il a remplacé une distribution par une autre où les régions uniformes autour des 5 et 6 étaient inchangées - de la même manière, je pense que le zoom arrière essaie de laisser les densités inchangées dans les cercles d'origine dans le paradoxe de Bertrand .
Neil G

1
@whuber: Vous avez raison. J'ai vraiment aimé la réponse de Potato à l'une de mes questions. Je pense personnellement qu'en cas de divergence entre la théorie et l'intuition, nous devrions rechercher de nouvelles théories plus complètes. Peut-être que le "principe d'indifférence" n'est pas tout à fait juste, ou n'est généralement pas réalisable, mais j'ai un désir naturel pour la théorie des probabilités de répondre à des questions pour lesquelles nous avons une compréhension intuitive. Peut-être que Lebesgue avait le même genre d'angoisse à propos de l'intégration de Riemann lorsqu'il a créé son intégrale?
Neil G

1

UNE=[5-ϵ2,5+ϵ2]B=[5-ϵ4,5+ϵ4][6-ϵ4,6+ϵ4]ϵ0

Permettez-moi de souligner à nouveau (et encore) que la méthode ci-dessus est utilisée pour l'intuition. Le conditionnement sur des événements de probabilité nulle se fait très souvent sans trop réfléchir. Le meilleur exemple auquel je peux penser est si (X1,X2)N(0,Σ)X1X2=0P(ξ=une)=0

Donc, oui, vous pouvez donner un sens au conditionnement sur des événements de mesure zéro.


5
UU[0,dix]0dixUNE={0}B={0,6}P(UNE|B)=1/2[0,dix]1/3500

2
εP(UNE|B)=P(UNEB)P(B)=5-ε45+ε4F(u)u5-ε45+ε4F(u)u+6-ε46+ε4F(u)u=ε2ε2+ε2=0,5

3
[5-ε8,5+ε8]18

4
C'est excellent pour l'intuition en montrant qu'il n'y a pas de réponse unique: c'est la base de la déclaration de Kolmogorov citée par @ Xi'an. Le fait que vous ayez dû modifier votre procédure pour faire sortir les choses comme vous le pensiez devrait vous alerter sur les problèmes de cette approche.
whuber

3
X2X1X2X1=0
En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.