"Le concept d'une probabilité conditionnelle par rapport à une hypothèse isolée dont la probabilité est égale à 0 est inadmissible." A. Kolmogorov
Pour les variables aléatoires continues, et Y disent, les distributions conditionnelles sont définies par la propriété qu'elles récupèrent la mesure de probabilité d'origine, c'est-à-dire pour tous les ensembles mesurables A ∈ B ( X ) , B ∈ B ( Y ) , P ( X ∈ A , Y ∈ B ) = ∫ B d P Y ( y ) ∫ B d P X | Y ( x |XYA∈B(X)B ∈ B( Y ) Cela implique que la densité conditionnelle est définie arbitrairement sur des ensembles de mesure zéro ou, en d'autres termes, que la densité conditionnelle p X | Y ( x | y ) est définipresque partout. Puisque l'ensemble { 5 , 6 } est de mesure zéro par rapport à la mesure de Lebesgue, cela signifie que vous pouvez définir à la fois p ( 5 ) et p ( 6 ) de manière absolument arbitraire et donc que la probabilité P ( U = 5 |
P (X∈ A ,Y∈ B ) = ∫Bd POui(y) ∫Bd PX| Oui( x |y)
pX| Oui( x |y){ 5 , 6 }p ( 5 )p ( 6 ) peut prendre n'importe quelle valeur.
P (U= 5 | U∈ { 5 , 6 } )
Cela ne signifie pas que vous ne pouvez pas définir une densité conditionnelle par la formule de rapport comme dans le cas normal bivarié mais simplement que la densité n'est définie presque partout que pour les deux x et y .
F( y| x)=f( x , y) / f( x )
Xy
"De nombreux arguments assez futiles ont fait rage - entre probabilistes autrement compétents - sur lequel de ces résultats est" correct "." ET Jaynes
Le fait que l'argument limitant (lorsque passe à zéro) dans la réponse ci-dessus semble donner une réponse naturelle et intuitive est lié au paradoxe de Borel . Le choix du paramétrage dans les matières limites, comme le montre l'exemple suivant que j'utilise dans mes cours de premier cycle.ϵ
Prenez la normale bivariée Quelle est la densité conditionnelle de X étant donné que X = Y ?X, Y∼iidN( 0 , 1 )
XX= Y
Si l'on part de la densité conjointe , la réponse "intuitive" est [proportionnelle à] φ ( x ) 2 . Ceci peut être obtenu en considérant le changement de variable ( x , t ) = ( x , y - x ) ∼ φ ( x ) φ ( t + x ) où T = Y - X a la densité φ (φ ( x ) φ ( y)φ ( x )2
( x , t ) = ( x , y- x ) ∼ φ ( x ) φ ( t + x )
T= Y- X . Donc
f(x|t)= φ ( x ) φ ( t + x )φ ( t / 2-√) / 2-√ et
f(x|t=0)=φ(x)φ(x)F( x | t ) = φ ( x ) φ ( t + x )φ ( t / 2-√) / 2-√
Cependant, si l'on considère plutôt le changement de variable
(x,r)=(étant donné que
Rest
f(x|rF( x | t = 0 ) = φ ( x ) φ ( x )φ ( 0 / 2-√) / 2-√= φ ( x )22-√
la densité marginale de
R = Y / X est la densité de Cauchy
ψ ( r ) = 1 / π { 1 + r 2 } et la densité conditionnelle de
X( x , r ) = ( x , y/ x)∼φ(x)φ(rx) | x |
R = Y/ Xψ ( r ) = 1 / π{ 1 + r2}XR Par conséquent,
f ( x | r = 1 ) = π φ ( x ) 2 | x | / 2F( x | r ) = φ ( x ) φ ( r x ) | x | × π{ 1 + r2}
Et là réside le « paradoxe »: les événements
R = 1 et
T = 0 sont les mêmes que
X = Y , mais elles conduisent à différentes densités conditionnelles sur
X .
F( x | r = 1 ) = πφ ( x )2| x | / 2.
R = 1T= 0X= YX