Comment trouve-t-on la moyenne d'une somme de variables dépendantes?

Je sais que la moyenne de la somme des variables indépendantes est la somme des moyennes de chaque variable indépendante. Cela s'applique-t-il également aux variables dépendantes?

mean non-independent

— Gh75m
source

@feetwet, supprimer simplement "merci" n'est pas vraiment assez important pour faire tomber un fil d'il y a 18 mois. FWIW, j'ai voté pour rejeter cette modification (mais 2 autres ont approuvé, vous n'auriez donc pas vu mon commentaire autrement).

— gung - Réintègre Monica

@gung - Toutes sortes de choses peuvent perturber la vue de la question "Active". Votre observation a été faite souvent, et AFAIK la politique d'échange de pile est que, malgré cet inconvénient, des modifications mineures valides sont une bonne chose .

— feetwet

@feetwet, je ne sais pas à quel point un message meta.Photography est pertinent. Chaque site SE a sa propre méta et ses propres politiques, décidées par la communauté. Vous voudrez peut-être regarder les fils de discussion meta.CV pertinents, par exemple, celui-ci: Gestion des «modifications suggérées» aux publications . Vous remarquerez peut-être que la réponse de Whuber cite Jeff Atwood, "de minuscules modifications, comme ... ne supprimant que la salutation d'un message. ... rejetez-les, avec des préjugés extrêmes", et joran fait le point, "Mon seuil pour quand un montage trop mineur est inversement lié à l'âge de la question ".

— gung - Rétablir Monica

@gung the Photography post J'ai référencé des liens vers un Q&A important et plus récent de Meta Stack Exchange sur le sujet . Mais si la réponse de 4 ans de whuber est toujours canonique pour la validation croisée, je respecterai cela à l'avenir.

— feetwet

Réponses:

L'attente (en prenant la moyenne) est un opérateur linéaire .

Cela signifie , entre autres, que $\mathbb{E}(X + Y) = \mathbb{E}(X) + \mathbb{E}(Y)$ pour deux variables aléatoires $X$ et $Y$ (pour lesquelles les attentes existent), qu'elles soient indépendantes ou non.

Nous pouvons généraliser (par exemple par induction ) de sorte que $\mathbb{E}\left(\sum_{i=1}^n X_i\right) = \sum_{i=1}^n \mathbb{E}(X_i)$ tant que chaque attente $\mathbb{E}(X_i)$ existe.

Alors oui, la moyenne de la somme est la même que la somme de la moyenne même si les variables sont dépendantes. Mais notez que cela ne s'applique pas à la variance! Ainsi, alors que $\mathrm{Var}(X + Y) = \mathrm{Var}(X) + \mathrm{Var}(Y)$ pour les variables indépendantes, ou même les variables qui sont dépendantes mais non corrélées , la formule générale est $\mathrm{Var}(X + Y) = \mathrm{Var}(X) + \mathrm{Var}(Y) + 2\mathrm{Cov}(X, Y)$ où $\mathrm{Cov}$ est lacovariancedes variables.

— Silverfish
source

TL; DR:
En supposant qu'elle existe, la moyenne est une valeur attendue, et la valeur attendue est une intégrale, et les intégrales ont la propriété de linéarité par rapport aux sommes.

TS; DR:
Puisque nous avons affaire à la somme des variables aléatoires , c'est-à-dire d'une fonction de beaucoup d'entre elles, la moyenne de la somme est par rapport à leur distribution conjointe ( on suppose que tous les moyens existent et sont finies) désignant le vecteur multivariée de la VR, leur densité joint peut être écrit sous la forme $Y_n = \sum_{i=1}^n X_i$ $E(Y_n)$ $\mathbf X$ $n$ et leur soutien commun En utilisant laloi du statisticien inconscient, nous avons l'intégralemultiple $f_{\mathbf X}(\mathbf x)= f_{X_1,...,X_n}(x_1,...,x_n)$ $D = S_{X_1} \times ...\times S_{X_n}$

E [Y_{n}] = \int_{D} Y_{n} f_{X} (x) d x

$E[Y_n] = \int_D Y_nf_{\mathbf X}(\mathbf x)d\mathbf x$

Dans certaines conditions de régularité, nous pouvons décomposer l'intégrale multiple en une intégrale itérative: $n$

E [Y_{n}] = \int_{S_{X_{n}}} . . . \int_{S_{X_{1}}} [\sum_{i = 1}^{n} X_{i}] f_{X_{1}, . . ., X_{n}} (x_{1}, . . ., x_{n}) d x_{1} . . . d x_{n}

$E[Y_n] = \int_{S_{X_n}}...\int_{S_{X_1}}\Big[\sum_{i=1}^n X_i\Big]f_{X_1,...,X_n}(x_1,...,x_n)dx_1...dx_n$

et en utilisant la linéarité des intégrales, nous pouvons nous décomposer en

= \int_{S_{X_{n}}} . . . \int_{S_{X_{1}}} x_{1} f_{X_{1}, . . ., X_{n}} (x_{1}, . . ., x_{n}) d x_{1} . . . d x_{n} + . . . . . . + \int_{S_{X_{n}}} . . . \int_{S_{X_{1}}} x_{n} f_{X_{1}, . . ., X_{n}} (x_{1}, . . ., x_{n}) d x_{1} . . . d x_{n}

$= \int_{S_{X_n}}...\int_{S_{X_1}}x_1f_{X_1,...,X_n}(x_1,...,x_n)dx_1...dx_n \; + ...\\ ...+\int_{S_{X_n}}...\int_{S_{X_1}}x_nf_{X_1,...,X_n}(x_1,...,x_n)dx_1...dx_n$

Pour chaque intégrale itérative, nous pouvons réorganiser l'ordre d'intégration de sorte que, dans chacune, l'intégration externe soit par rapport à la variable qui est en dehors de la densité de joint. À savoir, $n$

\int_{S_{X_{n}}} . . . \int_{S_{X_{1}}} x_{1} f_{X_{1}, . . ., X_{n}} (x_{1}, . . ., x_{n}) d x_{1} . . . d x_{n} = \int_{S_{X_{1}}} x_{1} \int_{S_{X_{n}}} . . . \int_{S_{X_{2}}} f_{X_{1}, . . ., X_{n}} (x_{1}, . . ., x_{n}) d x_{2} . . . d x_{n} d x_{1}

$\int_{S_{X_n}}...\int_{S_{X_1}}x_1f_{X_1,...,X_n}(x_1,...,x_n)dx_1...dx_n = \\\int_{S_{X_1}}x_1\int_{S_{X_n}}...\int_{S_{X_2}}f_{X_1,...,X_n}(x_1,...,x_n)dx_2...dx_ndx_1$

et en général

\int_{S_{X_{n}}} . . . \int_{S_{X_{j}}} . . . \int_{S_{X_{1}}} x_{j} f_{X_{1}, . . ., X_{n}} (x_{1}, . . ., x_{n}) d x_{1} . . . d x_{j} . . . d x_{n} =

$\int_{S_{X_n}}...\int_{S_{X_j}}...\int_{S_{X_1}}x_jf_{X_1,...,X_n}(x_1,...,x_n)dx_1...dx_j...dx_n =$

= \int_{S_{X_{j}}} X_{j} \int_{S_{X_{n}}} . . . \int_{S_{X_{j - 1}}} \int_{S_{X_{j + 1}}} . . . \int_{S_{X_{1}}} F_{X_{1}, . . ., X_{n}} (X_{1}, . . ., X_{n}) ré X_{1} . . . ré X_{j - 1} ré X_{j + 1} . . . . . . ré X_{n} ré X_{j}

$=\int_{S_{X_j}}x_j\int_{S_{X_n}}...\int_{S_{X_{j-1}}}\int_{S_{X_{j+1}}}...\int_{S_{X_1}}f_{X_1,...,X_n}(x_1,...,x_n)dx_1...dx_{j-1}dx_{j+1}......dx_ndx_j$

Comme nous calculons une par une l'intégrale dans chaque intégrale itérative (à partir de l'intérieur), nous «intégrons» une variable et nous obtenons à chaque étape la distribution «conjointe-marginale» des autres variables. Chaque intégrale itérative finira donc par . $n$ $n$ $\int_{S_{X_j}}x_jf_{X_j}(x_j)dx_j$

Rassemblant tout cela, nous arrivons à

E [{Oui}_{n}] = E [\sum_{je = 1}^{n} X_{je}] = \int_{S_{X_{1}}} X_{1} F_{X_{1}} (X_{1}) ré X_{1} + . . . + \int_{S_{X_{n}}} X_{n} F_{X_{n}} (X_{n}) ré X_{n}

$E[Y_n ] = E[\sum_{i=1}^n X_i] = \int_{S_{X_1}}x_1f_{X_1}(x_1)dx_1 +...+\int_{S_{X_n}}x_nf_{X_n}(x_n)dx_n$

Mais maintenant, chaque intégrale simple est la valeur attendue de chaque variable aléatoire séparément, donc

E [\sum_{je = 1}^{n} X_{je}] = E (X_{1}) + . . . + E (X_{n})

$E[\sum_{i=1}^n X_i] = E(X_1) + ...+E(X_n)$

= \sum_{je = 1}^{n} E (X_{je})

$= \sum_{i=1}^nE(X_i)$

Notez que nous n'avons jamais invoqué l'indépendance ou la non-indépendance des variables aléatoires impliquées, mais nous avons travaillé uniquement avec leur distribution conjointe.

— Alecos Papadopoulos
source

@ssdecontrol C'est un vote positif que j'apprécie, en effet .

— Alecos Papadopoulos

L'extension en intégrales itérées et inversement n'est pas nécessaire. Cela complique un argument simple. Vous pouvez remplacer la section "TS; DR" par sa dernière phrase et avoir une bonne réponse.

— whuber

@whuber Un an et demi plus tard, cela m'échappe encore (je veux dire, sans utiliser le fait "linéarité de l'opérateur d'attente", qui a déjà été utilisé par l'autre réponse). Un indice pour que je puisse retravailler la réponse vers ce simple argument?

— Alecos Papadopoulos

Je pense que l'argument est superflu. La clé de tout cela est votre observation dans la dernière phrase.

— whuber