Explication intuitive de la densité de la variable transformée?

Supposons que soit une variable aléatoire avec pdf . Alors la variable aléatoire a le pdf $X$ $f_X(x)$ $Y=X^2$

f_{Y} (y) = {\begin{cases} \frac{1}{2 \sqrt{y}} (f_{X} (\sqrt{y}) + f_{X} (- \sqrt{y})) & y \geq 0 \\ 0 & y < 0 \end{cases}

$f_Y(y)=\begin{cases}\frac{1}{2\sqrt{y}}\left(f_X(\sqrt{y})+f_X(-\sqrt{y})\right) & y \ge 0 \\ 0 & y \lt 0\end{cases}$

Je comprends le calcul derrière cela. Mais j'essaie de trouver un moyen de l'expliquer à quelqu'un qui ne connaît pas le calcul. En particulier, j'essaie d'expliquer pourquoi le facteur $\frac{1}{\sqrt{y}}$ apparaît devant. Je vais tenter le coup:

Supposons que $X$ ait une distribution gaussienne. Presque tout le poids de son pdf est entre les valeurs, par exemple, $-3$ et $3.$ Mais que les cartes à 0 à 9 pour $Y$ . Ainsi, le poids lourd dans le pdf pour $X$ a été étendue à travers une gamme plus large de valeurs dans la transformation à $Y$ . Ainsi, pour que $f_Y(y)$ soit un véritable pdf, le poids très lourd doit être réduit du facteur multiplicatif $\frac{1}{\sqrt{y}}$

Comment ça sonne?

Si quelqu'un pouvait fournir une meilleure explication ou un lien vers celui d'un document ou d'un manuel, je l'apprécierais beaucoup. Je trouve cet exemple de transformation variable dans plusieurs livres de statistiques mathématiques d'introduction et de probabilité. Mais je ne trouve jamais d'explication intuitive avec cela :(

random-variable pdf intuition

— lowndrul
source

Je pense que votre explication est correcte.

— highBandWidth

L'explication est juste, mais elle est purement qualitative: la forme précise du facteur multiplicatif reste un mystère. Le pouvoir -1/2 apparaît simplement comme par magie. Ainsi, à un certain niveau, vous devez faire la même chose que Calcul: trouver le taux de changement de la fonction racine carrée.

— whuber

Réponses:

Les PDF sont des hauteurs mais ils sont utilisés pour représenter une probabilité par surface. Il est donc utile d’exprimer un fichier PDF de manière à nous rappeler que la surface est égale à la hauteur multipliée par la base.

Initialement, la hauteur pour toute valeur $x$ est donnée par le PDF $f_X(x)$ . La base est le segment infinitésimal $dx$ , d'où la distribution (c'est-à-dire la mesure de probabilité opposée à la fonction de distribution ) est en réalité la forme différentielle, ou "élément de probabilité".

{PE}_{X} (x) = f_{X} (x) d x .

$\operatorname{PE}_X(x) = f_X(x) \, dx.$

Ceci, plutôt que le PDF, est l’objet avec lequel vous voulez travailler, tant sur le plan conceptuel que pratique, car il inclut explicitement tous les éléments. les éléments nécessaires pour exprimer une probabilité.

Lorsque nous ré-exprimons $x$ en termes de $y = x^2$ , les segments de base $dx$ sont étirés (ou pincés): en quadrillant les deux extrémités de l'intervalle de $x$ à $x + dx$ nous voyons que la base de la zone $y$ doit être un intervalle de longueur

d y = (x + d x)^{2} - x^{2} = 2 x d x + (d x)^{2} .

$dy = (x + dx)^2 - x^2 = 2 x \, dx + (dx)^2.$

Puisque le produit de deux infinitésimaux est négligeable par rapport aux infinitésimaux eux-mêmes, nous concluons

d y = 2 x d x, whence d x = \frac{d y}{2 x} = \frac{d y}{2 \sqrt{y}} .

$dy = 2 x \, dx, \text{ whence }dx = \frac{dy}{2x} = \frac{dy}{2\sqrt{y}}.$

Ceci étant établi, le calcul est trivial car il suffit de brancher la nouvelle hauteur et la nouvelle largeur:

{PE}_{X} (x) = f_{X} (x) d x = f_{X} (\sqrt{y}) \frac{d y}{2 \sqrt{y}} = {PE}_{Y} (y) .

$\operatorname{PE}_X(x) = f_X(x) \, dx = f_X(\sqrt{y}) \frac{dy}{2\sqrt{y}} = \operatorname{PE}_Y(y).$

Parce que la base, en termes de $y$ , est $dy$ , quel que soit le multiplie doit être la hauteur, que l' on peut lire directement sur le moyen terme comme

\frac{1}{2 \sqrt{y}} f_{X} (\sqrt{y}) = f_{Y} (y) .

$\frac{1}{2\sqrt{y}}f_X(\sqrt{y}) = f_Y(y).$

Cette équation $\operatorname{PE}_X(x) = \operatorname{PE}_Y(y)$ est effectivement une loi de conservation de la surface (= probabilité).

Two pdfs

Ce graphique montre avec précision les parties étroites (presque infinitésimales) de deux PDF liés par $y=x^2$ . Les probabilités sont représentées par les zones ombrées. En raison de la compression de l'intervalle $[0.32, 0.45]$ via la quadrature, la hauteur de la région rouge ( $y$ , à gauche) doit être proportionnellement étendue pour correspondre à la surface de la région bleue ( $x$ , à droite).

— whuber
source

J'aime les infinitésimaux. C'est une merveilleuse explication. Penser en termes de

, ce qui peut être vu clairement émerger de la dérivée de la transformation, est beaucoup plus intuitif que de penser en

2 x

$2x$

. Je pense que c’était là où était mon problème.

\sqrt{y}

$\sqrt{y}$

— lowndrul

@whuber, je crois que vous la première ligne devrait être

? Est-ce ce que vous entendez par

? PS: aussi curieux de savoir ce que vous pensez de ma réponse (ci-dessous).

P (X \in (x, x + d x)) = f_{x} (x) d x

$P(X \in (x, x + dx)) = f_{x}(x)dx$

{pdf}_{X} (x)

$\text{pdf}_{X}(x)$

— Carlos Cinelli

@Carlos It's a little more rigorous to express the idea in the way I did at the outset: the PDF is what you multiply the Lebesgue measure

d x

$\mathrm{d}x$ by in order to get the given probability measure.

— whuber

@whuber but if the pdf is what you multiply then it is the term

f_{X} (x)

$f_{X}(x)$ , not the product

f_{x} (x) d x

$f_{x}(x)dx$ as you wrote, right? It is not clear why you call the product

f_{X} (x) d x

$f_{X}(x)dx$ a pdf.

— Carlos Cinelli

@Carlos: thank you; now I see your point. I made some edits to address it.

— whuber

How about, if I manufacture objects that are always square and I know the distribution of the side lengths of the squares; what can I say about the distribution of the areas of the squares?

In particular, if I know the distribution of a random variable $X$ , what can I say about $Y = X^{2}$ ? One thing that you can say is

\begin{aligned} F_{Y} (c) & = & P (Y \leq c) \\ = & P (X^{2} \leq c) \\ = & P (- \sqrt{c} \leq X \leq \sqrt{c}) \\ = & F_{X} (\sqrt{c}) - F_{X} (- \sqrt{c}) . \end{aligned}

$\eqalign{ F_{Y} (c) & = & P( Y \le c ) \\ & = & P( X^{2} \le c ) \\ & = & P ( - \sqrt{c} \le X \le \sqrt{c}) \\ & = & F_{X}( \sqrt{c} ) - F_{X}( - \sqrt{c} ). \\ }$

So a relationship is established between the CDF of $Y$ and CDF of $X$ ; what is the relationship between their PDFs? We need calculus for that. Taking the derivatives of both sides gives you the results you wanted.

— schenectady
source

(+1) Although this is not a full answer, it presents a good way to go about finding

f_{Y}

$f_Y$ and clearly shows why it is a sum of two pieces, one for each square root.

— whuber

I don't get why pdf(x) = f(x)dx. What about pdf(x) dx = f(x), density = prob mass/interval...what i'm getting wrong?

— Fernando

Imagine we have a population and $Y$ is a summary of that population. Then $P(Y \in (y, y + \Delta y))$ is counting the proportion of individuals that have variable $Y$ in the range $(y, y + \Delta y)$ . You can consider this as a "bin" of size $\Delta y$ and we are counting how many individuals are inside that bin.

Now let us re-express those individuals in terms of another variable, $X$ . Given that we know that $Y$ and $X$ are related as $Y = X^2$ , the event $Y\in (y, y + \Delta y)$ is the same as the event $X^2 \in (x^2, (x + \Delta x)^2)$ which is the same as the event $X \in (|x|, |x| + \Delta x)~ \text{or}~ X \in (- |x| -\Delta x, -|x| )$ . Thus, the individuals that are in the bin $(y, y + \Delta y)$ must also be in the bins $(|x|, |x| + \Delta x)$ and $(- |x| -\Delta x, -|x| )$ . In other words, those bins must have the same proportion of individuals,

\begin{aligned} P (Y \in (y, y + Δ y)) & = P (X \in (| x |, | x | + Δ x)) + P (X \in (- | x | - Δ x, - | x |)) \end{aligned}

$\begin{align} P(Y \in (y, y + \Delta y)) &=P\left( X \in (|x|, |x| + \Delta x) \right) + P\left( X \in (- |x| -\Delta x, -|x| )\right) \end{align}$

Ok, now let's get to the density. First, we need to define what a probability density is. As the name suggests, it is the proportion of individuals per area. That is, we count the share of individuals on that bin and divide by the size of the bin. Since we have established that the proportions of people are the same here, but the size of the bins have changed, we conclude the density will be different. But different by how much?

As we said, the probability density is the proportion of people in the bin divided by the size of the bin, thus the density of $Y$ is given by $f_Y(y):=\frac{P(Y \in (y, y + \Delta y))}{\Delta y}$ . Analogously, the probability density of $X$ is given by $f_X(x):=\frac{P(X \in (x, x + \Delta x))}{\Delta x}$ .

From our previous result that the population in each bin is the same we then have that,

\begin{aligned} f_{Y} (y) := \frac{P (Y \in (y, y + Δ y))}{Δ y} & = \frac{P (X \in (| x |, | x | + Δ x)) + P (X \in (- | x | - Δ x, - | x |))}{Δ y} \\ = \frac{f_{X} (| x |) Δ x + f_{X} (- | x |) Δ x}{Δ y} \\ = \frac{Δ x}{Δ y} (f_{X} (| x |) + f_{X} (- | x |)) \\ = \frac{Δ x}{Δ y} (f_{X} (\sqrt{y}) + f_{X} (- \sqrt{y})) \end{aligned}

$\begin{align} f_Y(y):=\frac{P(Y \in (y, y + \Delta y))}{\Delta y} &= \frac{P\left( X \in (|x|, |x| + \Delta x) \right) + P\left( X \in (- |x| - \Delta x, -|x| )\right)}{\Delta y} \\ &= \frac{f_X(|x|)\Delta x + f_{X}(-|x|)\Delta x}{\Delta y}\\ &= \frac{\Delta x}{\Delta y} \left(f_X(|x|) + f_{X}(-|x|) \right)\\ &= \frac{\Delta x}{\Delta y} \left(f_X(\sqrt{y}) + f_{X}(-\sqrt{y}) \right) \end{align}$

That is, the density $f_X(\sqrt{y}) + f_{X}(-\sqrt{y})$ changes by the factor $\frac{\Delta x}{\Delta y}$ , which is the relative size of stretching or squeezing the bin size. In our case, since $y = x^2$ we have that $y + \Delta y = (x + \Delta x )^2 = x^2 + 2x \Delta x + \Delta x^2$ . If $\Delta x$ is tiny enough we can ignore $\Delta x ^2$ , which implies $\Delta y = 2x \Delta x$ and $\frac{\Delta x}{\Delta y} = \frac{1}{2x} = \frac{1}{2 \sqrt{y}}$ , and that is why the factor $\frac{1}{2 \sqrt{y}}$ shows up in the transformation.

— Carlos Cinelli
source