Quelle est la probabilité que

Supposons que $X$ et $Y$ soient normaux bivariés avec la moyenne $\mu=(\mu_1,\mu_2)$ et la covariance $\Sigma = \begin{bmatrix} \sigma_{11} & \sigma_{12} \\ \sigma_{12} & \sigma_{22} \\ \end{bmatrix}$ . Quelle est la probabilité $\Pr\left(X<Y|\min\left(X,Y\right)\right)$ ?

probability normal-distribution conditional-probability

— Mike
source

@whuber, merci, j'ai supprimé mes pensées car elles n'ajoutent rien ici.

— AdamO

\frac{P r (m < Y | X = m)}{P r (m < Y | X = m) + P r (m < X | Y = m)}

$\frac{Pr(m<Y|X=m)}{Pr(m<Y|X=m)+Pr(m<X|Y=m)}$

— Sextus Empiricus

lien utile stats.stackexchange.com/questions/30588/… S'agit-il d'une question d'autoformation?

— Sextus Empiricus

Vous devriez partager vos réflexions sur le problème, indépendamment du fait que cela ressemble à une question d'auto-étude.

— StubbornAtom

Réponses:

En utilisant la notation légèrement plus explicite , où est un nombre réel, pas une variable aléatoire. L'ensemble sur lequel est un chemin en forme de L avec deux segments semi-ouverts: l'un allant directement du point et l'autre allant directement vers la droite de ce même point. Il est clair que sur la jambe verticale, et sur la jambe horizontale . $P(X<Y|\min(X, Y)=m)$ $m$ $\min(X,Y) = m$ $(m,m)$ $x<y$ $x>y$

Compte tenu de cette intuition géométrique, il est facile de réécrire le problème sous une forme équivalente, où au numérateur nous n'avons que la jambe verticale où et au dénominateur nous avons la somme des deux jambes. $x<y$

$P(X<Y|\min(X, Y)) = \frac{ \displaystyle P(m<Y|X=m) }{ \displaystyle P(m<Y|X=m) + P(m<X|Y=m) } \tag{1}$

Il nous faut donc maintenant calculer deux expressions de la forme . De telles probabilités conditionnelles de la distribution normale bivariée ont toujours une distribution normale avec des paramètres: $P(m<X|Y=m)$ $\mathcal{N}\left(\mu_{X|Y=m}, s^2_{X|Y=m}\right)$

$\mu_{X|Y=m} = \mu_1+\frac{\displaystyle \sigma_{12}}{\displaystyle \sigma_{22}}({m}-\mu_2) \tag{2}$

$s^2_{X|Y=m} = \sigma_{11}-\frac{\displaystyle \sigma_{12}^2}{\displaystyle \sigma_{22}} \tag{3}$

Notez que dans la définition originale du problème, faisait référence à des éléments de la matrice de covariance, contrairement à la convention la plus courante d'utilisation de pour l'écart type. Ci-dessous, nous trouverons plus pratique d'utiliser pour la variance et pour l'écart-type de la distribution de probabilité conditionnelle. $\sigma_{ij}$ $\sigma$ $s^2$ $s$

Connaissant ces deux paramètres, nous pouvons calculer la probabilité que partir de la fonction de distribution cumulative. $m<X$

$P(m<X|Y=m) = \Phi \left(\frac{\displaystyle \mu_{X;Y=m} -m}{\displaystyle s_{X;Y=m}} \right) \tag{4}$

mutatis mutandis , nous avons une expression similaire pour . Laisser $P(Y>m|X=m)$

$z_{X|Y=m} = \frac{\displaystyle \mu_{X;Y=m} - m}{\displaystyle s_{X;Y=m}} \tag{5}$

$z_{Y|X=m} = \frac{\displaystyle \mu_{Y;X=m} -m}{\displaystyle s_{Y;X=m}} \tag{6}$

Ensuite, nous pouvons écrire la solution complète de manière compacte en termes de ces deux scores : $z$

$P(X<Y|\min(X, Y)=m) = 1 - \frac{ \displaystyle \Phi(z_{X|Y=m}) }{ \displaystyle \Phi(z_{X|Y=m})+\Phi(z_{Y|X=m}) } \tag{7}$

Sur la base du code de simulation fourni par l'auteur de la question, nous pouvons comparer ce résultat théorique aux résultats simulés:

— olooney
source

Dans (3), je pense que le côté gauche devrait avoir un carré, car c'est la variance conditionnelle alors que l'écart-type est utilisé plus tard.

— Yves

Vous avez tout à fait raison @Yves, et je pense que mes modifications récentes ont résolu le problème. Je vous remercie.

— olooney

@olooney, merci pour cette réponse. Je peux suivre la dérivation et cela semble correct. Cependant, j'ai essayé de vérifier (1) et (7) dans une simulation et les résultats étaient assez différents. Vous pouvez voir mon code R ici gist.github.com/mikeguggis/d041df05565f63f8be2c6c51f5cf8961

— mike

@mike, je pense que j'ai eu une erreur de signe. Après avoir corrigé cela, le résultat théorique semble être en accord avec les résultats de la simulation. gist.github.com/olooney/e88a66d2d2fa7f2f0cd0d0dd6b708739

— olooney

@olooney, bonne prise. Je n'arrive toujours pas à comprendre pourquoi les deux estimations basées sur la simulation ne correspondent pas (lignes 30 à 32 dans mon code).

— mike

La question peut être réécrite en utilisant une version modifiée du théorème de Bayes (et un abus de notion pour ) $Pr$

\begin{aligned} P r (X < Y | m i n (X, Y) = m) & = \frac{P r (m i n (X, Y) = m | X < Y) P r (X < Y)}{P r (m i n (X, Y) = m | X < Y) P r (X < Y) + P r (m i n (X, Y) = m | X \geq Y) P r (X \geq Y)} \\ = \frac{P r (X < Y, m i n (X, Y) = m)}{P r (X < Y, m i n (X, Y) = m) + P r (X \geq Y, m i n (X, Y) = m)} . \end{aligned}

$\begin{align} Pr(X<Y|min(X,Y) = m) &= \frac{Pr(min(X,Y)=m|X<Y)Pr(X<Y)}{Pr(min(X,Y)=m|X<Y)Pr(X<Y)+Pr(min(X,Y)=m|X\geq Y)Pr(X\geq Y)}\\ &= \frac{Pr(X<Y,min(X,Y)=m)}{Pr(X<Y,min(X,Y)=m)+Pr(X\geq Y,min(X,Y)=m)}. \end{align}$

Définissez comme le PDF bivarié de et , et . alors $f_{X,Y}$ $X$ $Y$ $\phi(x) = \frac{1}{\sqrt{2\pi}}exp(-\frac{1}{2}x^2)$ $\Phi(x) = \int_{-\infty}^x\phi(t)dt$

\begin{aligned} P r (X < Y, m i n (X, Y) = m) & = P r (X = m, Y > m) \\ = \int_{m}^{\infty} f_{X, Y} (m, t) d t \end{aligned}

$\begin{align} Pr(X<Y,min(X,Y)=m) &=Pr(X=m,Y>m) \\ &= \int_m^\infty f_{X,Y}(m,t)dt \end{align}$

\begin{aligned} P r (X \geq Y, m i n (X, Y) = m) & = P r (X \geq m, Y = m) \\ = \int_{m}^{\infty} f_{X, Y} (t, m) d t \end{aligned}

$\begin{align} Pr(X\geq Y,min(X,Y)=m) &=Pr(X\geq m,Y=m) \\ &= \int_m^\infty f_{X,Y}(t,m)dt \end{align}$

En utilisant la normalité et la définition de la probabilité conditionnelle, les intégrandes peuvent être réécrits comme

f_{X, Y} (m, t) = f_{Y | X} (t) f_{X} (m) = \frac{1}{\sqrt{σ_{Y | X}}} ϕ (\frac{t - μ_{Y | X}}{\sqrt{σ_{Y | X}}}) \frac{1}{\sqrt{σ_{11}}} ϕ (\frac{m - μ_{1}}{\sqrt{σ_{11}}})

$f_{X,Y}(m,t) = f_{Y|X}(t)f_X(m) = \frac{1}{\sqrt{\sigma_{Y|X}}}\phi\left(\frac{t-\mu_{Y|X}}{\sqrt{\sigma_{Y|X}}}\right)\frac{1}{\sqrt{\sigma_{11}}}\phi\left(\frac{m-\mu_1}{\sqrt{\sigma_{11}}}\right)$

f_{X, Y} (t, m) = f_{X | Y} (t) f_{Y} (m) = \frac{1}{\sqrt{σ_{X | Y}}} ϕ (\frac{t - μ_{X | Y}}{\sqrt{σ_{X | Y}}}) \frac{1}{\sqrt{σ_{22}}} ϕ (\frac{m - μ_{2}}{\sqrt{σ_{22}}}) .

$f_{X,Y}(t,m) = f_{X|Y}(t)f_Y(m) = \frac{1}{\sqrt{\sigma_{X|Y}}}\phi\left(\frac{t-\mu_{X|Y}}{\sqrt{\sigma_{X|Y}}}\right)\frac{1}{\sqrt{\sigma_{22}}}\phi\left(\frac{m-\mu_2}{\sqrt{\sigma_{22}}}\right).$

Où

μ_{X | Y} = μ_{1} + \frac{σ_{12}}{σ_{22}} (m - μ_{2}),

$\mu_{X|Y} = \mu_1 + \frac{\sigma_{12}}{\sigma_{22}}(m-\mu_2),$

μ_{Y | X} = μ_{2} + \frac{σ_{12}}{σ_{11}} (m - μ_{1}),

$\mu_{Y|X} = \mu_2 + \frac{\sigma_{12}}{\sigma_{11}}(m-\mu_1),$

σ_{X | Y} = (1 - \frac{σ_{12}^{2}}{σ_{11} σ_{22}}) σ_{11}

$\sigma_{X|Y} = \left(1-\frac{\sigma_{12}^2}{\sigma_{11}\sigma_{22}}\right)\sigma_{11}$

σ_{Y | X} = (1 - \frac{σ_{12}^{2}}{σ_{11} σ_{22}}) σ_{22} .

$\sigma_{Y|X} = \left(1-\frac{\sigma_{12}^2}{\sigma_{11}\sigma_{22}}\right)\sigma_{22}.$

Donc

P r (X < Y | m i n (X, Y) = m) = \frac{(1 - Φ (\frac{m - μ_{Y | X}}{\sqrt{σ_{Y | X}}})) \frac{1}{\sqrt{σ_{11}}} ϕ (\frac{m - μ_{1}}{\sqrt{σ_{11}}})}{(1 - Φ (\frac{m - μ_{Y | X}}{\sqrt{σ_{Y | X}}})) \frac{1}{\sqrt{σ_{11}}} ϕ (\frac{m - μ_{1}}{\sqrt{σ_{11}}}) + (1 - Φ (\frac{m - μ_{X | Y}}{\sqrt{σ_{X | Y}}})) \frac{1}{\sqrt{σ_{22}}} ϕ (\frac{m - μ_{2}}{\sqrt{σ_{22}}})} .

$\begin{equation} Pr(X<Y|min(X,Y) = m) = \frac{\left(1-\Phi\left(\frac{m-\mu_{Y|X}}{\sqrt{\sigma_{Y|X}}}\right)\right)\frac{1}{\sqrt{\sigma_{11}}}\phi\left(\frac{m-\mu_1}{\sqrt{\sigma_{11}}}\right)}{\left(1-\Phi\left(\frac{m-\mu_{Y|X}}{\sqrt{\sigma_{Y|X}}}\right)\right)\frac{1}{\sqrt{\sigma_{11}}}\phi\left(\frac{m-\mu_1}{\sqrt{\sigma_{11}}}\right)+\left(1-\Phi\left(\frac{m-\mu_{X|Y}}{\sqrt{\sigma_{X|Y}}}\right)\right)\frac{1}{\sqrt{\sigma_{22}}}\phi\left(\frac{m-\mu_2}{\sqrt{\sigma_{22}}}\right)}. \end{equation}$

Cette forme finale est très similaire au résultat auquel @olooney est arrivé. La différence est que ses probabilités ne sont pas pondérées par les densités normales.

Un script R pour la vérification numérique peut être trouvé ici

— Mike
source