Quelle est la signification intuitive du branchement d'une variable aléatoire dans son propre pdf ou cdf?

Un pdf est généralement écrit comme , où le minuscule est traité comme une réalisation ou un résultat de la variable aléatoire qui a ce pdf. De même, un cdf est écrit comme , qui a la signification . Cependant, dans certaines circonstances, telles que la définition de la fonction de score et cette dérivation selon laquelle le cdf est uniformément distribué , il semble que la variable aléatoire soit connectée à son propre pdf / cdf; ce faisant, nous obtenons une nouvelle variable aléatoire ou $f(x|\theta)$ $x$ $X$ $F_X(x)$ $P(X<x)$ $X$ $Y=f(X|\theta)$ $Z=F_X(X)$ . Je ne pense pas que nous puissions appeler cela un pdf ou un cdf car c'est maintenant une variable aléatoire elle-même, et dans ce dernier cas, l '"interprétation" me semble absurde. $F_X(X)=P(X<X)$

De plus, dans ce dernier cas ci-dessus, je ne suis pas sûr de comprendre l'énoncé "le cdf d'une variable aléatoire suit une distribution uniforme". Le cdf est une fonction, pas une variable aléatoire, et n'a donc pas de distribution. Au contraire, ce qui a une distribution uniforme est la variable aléatoire transformée en utilisant la fonction qui représente son propre cdf, mais je ne vois pas pourquoi cette transformation est significative. Il en va de même pour la fonction de score, où nous connectons une variable aléatoire à la fonction qui représente sa propre log-vraisemblance.

Cela fait des semaines que je me défonce le cerveau en essayant de trouver une signification intuitive derrière ces transformations, mais je suis coincé. Toute idée serait grandement apprécié!

— mai
source

La notation peut vous dérouter. Par exemple, est exactement aussi significatif que l'application d' une fonction mesurable à serait. Pour une interprétation correcte, vous devrez être très clair sur ce qu'est une variable aléatoire . Pour toute variable aléatoire la fonction for est clairement une variable aléatoire et a donc une distribution(Notez les deux significations distinctes du symbole " " dans " ".) est uniforme si et seulement si a une distribution continue.

F_{X} (X)

$F_X(X)$

X

$X$

X : Ω \to R,

$X:\Omega\to\mathbb{R},$

Y : ω \to F_{X} (X (ω))

$Y:\omega\to F_X(X(\omega))$

ω \in Ω

$\omega\in\Omega$

F_{Y} .

$F_Y.$

X

$X$

F_{X} (X)

$F_X(X)$

F_{Y}

$F_Y$

X

$X$

— whuber

Ce n'est pas vraiment un problème de mesure théorique: pour le comprendre, vous pouvez ignorer en toute sécurité toutes les références à la «mesurabilité». Vous pourriez bénéficier d'étudier un peu la théorie des ensembles au début de votre carrière universitaire: c'est là que la plupart des gens apprennent ce que signifient réellement cette terminologie et notation mathématiques de base (et omniprésentes), il est donc préférable de ne pas différer l'apprentissage.

— whuber

Peut-être un mot sur pourquoi on devrait faire une chose folle comme ça: insérer un VR dans sa propre densité !!?! Un exemple: disons que vous voulez estimer la densité de X alors vous pourriez mesurer votre qualité en intégrant sur mais c'est «injuste»: vous n'obtiendrez jamais une bonne approximation lorsque vous n'avez pas beaucoup d'exemples de données (c'est-à-dire que la vraie densité est petite). Par conséquent, une évaluation «juste» consisterait à pondérer le terme par la densité réelle. C'est plus ou moins l'effet d'insérer des VR dans leurs propres densités ...

f (x) - f_{X} (x)

$f(x)-f_X(x)$

— Fabian Werner

Voir aussi stats.stackexchange.com/questions/324768/…

— Fabian Werner

Réponses:

Comme vous le dites, toute fonction (mesurable) d'une variable aléatoire est elle-même une variable aléatoire. Il est plus facile de penser à et comme "n'importe quelle ancienne fonction". Ils ont juste de belles propriétés. Par exemple, si est un RV exponentiel standard, alors il n'y a rien de particulièrement étrange dans la variable aléatoire Il se trouve que . Le fait que a une distribution uniforme (étant donné que est un RV continu) peut être vu dans le cas général en dérivant le CDF de . $f(x)$ $F(x)$ $X$

Y = 1 - e^{- X}

$Y = 1 - e^{-X}$

Y = F_{X} (X)

$Y=F_X(X)$

Y

$Y$

X

$X$

Y

$Y$

\begin{aligned} F_{Y} (y) & = P (Y \leq y) \\ = P (F_{X} (X) \leq y) \\ = P (X \leq F_{X}^{- 1} (y)) \\ = F_{X} (F_{X}^{- 1} (y)) \\ = y \end{aligned}

$\begin{align*} F_Y(y) &= P(Y \leq y) \\ &= P(F_X(X) \leq y) \\ &= P(X \leq F^{-1}_X(y)) \\ &= F_X(F^{-1}_X(y)) \\ &= y \end{align*}$

Qui est clairement le CDF d'une variable aléatoire . Remarque: Cette version de la preuve suppose que est strictement croissant et continu, mais il n'est pas trop difficile de montrer une version plus générale. $U(0,1)$ $F_X(x)$

— knrumsey
source

Votre conclusion est incorrecte pour l'augmentation la plus stricte de : vous avez supposé que est l'identité - mais ce n'est pas toujours le cas.

F_{X}

$F_X$

F_{X} \circ F_{X}^{- 1}

$F_X\circ F_X^{-1}$

— whuber

Oui merci. La variable aléatoire doit clairement être continue. Suis-je en train de manquer quelque chose maintenant?

X

$X$

— knrumsey

F_{X}

$F_X$ n'a pas besoin d'être bijectif. Prenons, par exemple, le cas où lui-même a une distribution uniforme! La fermeture de l'image de

X

$X$

doit être la totalité de l'intervalle

C'est essentiellement la définition d'une distribution continue.

F_{X}

$F_X$

[0, 1] .

$[0,1].$

— whuber

Une transformée d'une variable aléatoire par une fonction mesurable est une autre variable aléatoire dont la distribution est donnée par la transformée de probabilité inverse $X$ $T:\mathcal{X}\longrightarrow\mathcal{Y}$ $Y=T(X)$ pour tous les ensembles tels que

P (Y \in A) = P (X \in {x; T (x) \in A}) \overset{def}{=} P (X \in T^{- 1} (A))

$\mathbb{P}(Y\in A) = \mathbb{P}(X\in\{x;\,T(x)\in A\})\stackrel{\text{def}}{=} \mathbb{P}(X\in T^{-1}(A))$

A

$A$

est mesurable dans la distribution de

{x; T (x) \in A}

$\{x;\,T(x)\in A\}$

X

$X$

$F_X:\mathcal{X}\longrightarrow[0,1]$ $X$ $Y=F_X(X)$ $[0,1]$ $Y$ $\mathcal{U}([0,1])$ $F_X$ $F_X$ $Y=F_X(X)$ $[0,1]$ $U$ $\mathcal{U}([0,1])$ $F_X^{-}(U)$ $X$ $F_X^{-}$ $F_X$ $\omega\in\Omega$ $X(\omega)=F_X^{-}(\omega)$ $F_X$ $F_X$

$\mathbb{P}(X\le X)$

F_{X} (x) = P (X \leq x) = \int_{0}^{x} d F_{X} (x) = \int_{0}^{x} f_{X} (x) d λ (x)

$F_X(x)=\mathbb{P}(X\le x)=\int_0^x \text{d}F_X(x) = \int_0^x f_X(x)\,\text{d}\lambda(x)$

d λ

$\text{d}\lambda$

f_{X}

$f_X$

F_{X} (X) = \int_{0}^{X} d F_{X} (x) = \int_{0}^{X} f_{X} (x) d λ (x)

$F_X(X)=\int_0^X \text{d}F_X(x) = \int_0^X f_X(x)\,\text{d}\lambda(x)$

P (X \leq X)

$\mathbb{P}(X\le X)$

X

$X$

X_{1}

$X_1$

X_{2}

$X_2$

F_{X} (X_{1})

$F_X(X_1)$

F_{X} (X_{1}) = P^{X_{2}} (X_{2} \leq X_{1})

$F_X(X_1)=\mathbb{P}^{X_2}(X_2\le X_1)$

X_{2}

$X_2$

$f_X(X)$ $f_X$ $f_X(X|\hat{\theta}(X))/f_X(X|\theta_0)$ $\chi^2$

\frac{\partial \log f_{X} (X | θ)}{\partial θ}

$\dfrac{\partial \log f_X(X|\theta)}{\partial \theta}$

θ

$\theta$

E_{θ_{0}} [\frac{\partial \log f_{X} (X | θ_{0})}{\partial θ}] = \int \frac{\partial \log f_{X} (x | θ_{0})}{\partial θ} f_{X} (x | θ_{0}) d λ (x) = 0

$\mathbb{E}_{\theta_0}\left[ \dfrac{\partial \log f_X(X|\theta_0)}{\partial \theta}\right]=\int \dfrac{\partial \log f_X(x|\theta_0)}{\partial \theta}f_X(x|\theta_0)\,\text{d}\lambda(x)=0$

[Réponse tapée pendant que @whuber et @knrumsey tapaient leurs réponses respectives!]

— Xi'an
source

F_{X} (X_{1}) = P (X_{2} \leq X_{1})

$F_X(X_1)=P(X_2 \leq X_1)$

F_{X}

$F_X$

X

$X$

F_{X} (X)

$F_X(X)$

Oui, je suis d'accord que ce n'est pas la même chose. Dans le premier cas, ce n'est pas un VR, alors que dans le second cas, c'est un RV. Ai-je raison?

— mai

X

$X$

F_{X} (X)

$F_X(X)$

θ

$\theta$

θ

$\theta$

θ

$\theta$