Valeur attendue des variables aléatoires iid

Je suis tombé sur cette dérivation que je ne comprends pas: si sont des échantillons aléatoires de taille n pris dans une population de moyenne et de variance , alors $X_1, X_2, ..., X_n$ $\mu$ $\sigma^2$

$\bar{X} = (X_1 + X_2 + ... + X_n)/n$

$E(\bar{X}) = E(X_1 + X_2 + ... + X_n)/n = (1/n)(E(X_1) + E(X_2) + ... + E(X_n))$

$E(\bar{X}) = (1/n)(\mu + \mu + ...n ~\text{times}) = \mu$

C'est là que je suis perdu. L'argument utilisé est car ils sont distribués de façon identique. En réalité, ce n'est pas vrai. Supposons que j'ai un échantillon, , puis si je sélectionne au hasard 2 nombres avec remplacement et répète cette procédure 10 fois, alors j'obtiens 10 échantillons: (5, 4) (2, 5) (1, 2) (4, 1) (4, 6) (2, 4) (6, 1) (2, 4) (3, 1) (5, 1). Voici à quoi cela ressemble pour 2 variables aléatoires . Maintenant, si je prends la valeur d'attente de que j'obtiens, $E(X_i) = \mu$ $S=\{1,2,3,4,5,6\}$ $X_1, X_2$ $X_1$

$E(X_1) = 1.(1/10) + 2.(3/10) + 3.(1/10) + 4.(2/10) + 5.(2/10) + 6.(1/10) = 34/10 = 3.4$

Mais la valeur attendue de la population est de 3,5. Qu'est-ce qui ne va pas dans mon raisonnement?

— RenamedUser7008
source

Ce qui ne va pas, c'est que est une variable aléatoire et non un échantillon ...

X

$X$

— Tim

Vous confondez la moyenne empirique basée sur un échantillon et la moyenne probabiliste basée sur la distribution de la population. Le premier est aléatoire, le second ne l'est pas.

— Xi'an

Tout d'abord, ne sont pas des échantillons. Ce sont des variables aléatoires comme l'a souligné Tim. Supposons que vous effectuez une expérience dans laquelle vous estimez la quantité d'eau dans un aliment; pour cela, vous prenez par exemple 100 mesures de la teneur en eau pour 100 aliments différents. Chaque fois que vous obtenez une valeur de la teneur en eau. Ici, la teneur en eau est variable au hasard et supposons maintenant qu'il y avait au total 1000 produits alimentaires qui existent dans le monde. 100 aliments différents seront appelés un échantillon de ces 1000 aliments. Notez que la teneur en eau est la variable aléatoire et 100 valeurs de la teneur en eau obtenue constituent un échantillon. $X_1, X_2,...,X_n$

Supposons que vous échantillonnez au hasard n valeurs à partir d'une distribution de probabilité, indépendamment et identiquement, Il est donné que . Vous devez maintenant trouver la valeur attendue de . Étant donné que chacun des est échantillonné de manière indépendante et identique, la valeur attendue de chacun des est . Vous obtenez donc . $E(X)=\mu$ $\bar{X}$ $X_i$ $X_i$ $\mu$ $\frac{n\mu}{n} =\mu$

La troisième équation de votre question est la condition pour qu'un estimateur soit un estimateur non biaisé du paramètre de population. La condition pour qu'un estimateur soit sans biais est

E (\bar{θ}) = θ

$E(\bar{\theta})=\theta$

où thêta est le paramètre de population et est le paramètre estimé par échantillon. $\bar{\theta}$

Dans votre exemple, votre population est et vous avez reçu un échantillon de valeurs iid qui sont . La question est de savoir comment estimer la moyenne de la population compte tenu de cet échantillon. Selon la formule ci-dessus, la moyenne de l'échantillon est un estimateur non biaisé de la moyenne de la population. L'estimateur non biaisé n'a pas besoin d'être égal à la moyenne réelle, mais il est aussi proche de la moyenne que vous pouvez obtenir compte tenu de cette information. $\{1,2,3,4,5,6\}$ $10$ $\{5,2,1,4,4,2,6,2,3,5\}$

— Abhinav Gupta
source