Pourquoi l'attente est-elle la même chose que la moyenne arithmétique?


47

Aujourd'hui, je suis tombé sur un nouveau sujet appelé l'espérance mathématique. Dans le livre que je suis en train de suivre, l’attente est la moyenne arithmétique des variables aléatoires provenant de toute distribution de probabilité. Mais, il définit les attentes comme la somme du produit de certaines données et de leur probabilité. Comment ces deux (moyenne et attente) peuvent-ils être identiques? Comment la somme des probabilités fois les données peut-elle être la moyenne de la distribution entière?

Réponses:


51

De manière informelle, une distribution de probabilité définit la fréquence relative des résultats d'une variable aléatoire - la valeur attendue peut être considérée comme une moyenne pondérée de ces résultats (pondérée par la fréquence relative). De même, la valeur attendue peut être considérée comme la moyenne arithmétique d'un ensemble de nombres générés exactement proportionnellement à leur probabilité d'occurrence (dans le cas d'une variable aléatoire continue, cela n'est pas tout à fait vrai puisque les valeurs spécifiques ont une probabilité égale à ).0

Le lien entre la valeur attendue et la moyenne arithmétique est le plus clair avec une variable aléatoire discrète, où la valeur attendue est

E(X)=SxP(X=x)

est l’espace échantillon. Par exemple, supposons que vous ayez une variable aléatoire discrète X telle que:SX

X={1with probability 1/82with probability 3/83with probability 1/2

P(X=1)=1/8P(X=2)=3/8P(X=3)=1/2

E(X)=1(1/8)+2(3/8)+3(1/2)=2.375

{1,1,2,2,2,2,2,2,3,3,3,3,3,3,3,3}123

1+1+2+2+2+2+2+2+3+3+3+3+3+3+3+316=2.375

et vous pouvez voir que c'est exactement égal à la valeur attendue.


Cela ne serait-il pas mieux illustré en utilisant l'ensemble plus simple de {1,2,2,2,3,3,3,3}}? L'expression indiquant la moyenne arithmétique de cet ensemble est identique à l'expression indiquant l'espérance attendue de cette variable (si vous convertissez les produits pondérés en sommes simples).
Dancrumb

Re: "L'expression indiquant la moyenne arithmétique de cet ensemble est identique à l'expression indiquant la valeur attendue de cette variable (si vous convertissez les produits pondérés en sommes simples)" - Oui @Dancrumb, c'était tout le point :)
Macro

12

L’attente est la valeur moyenne ou la moyenne d’une variable aléatoire et non d’une distribution de probabilité. En tant que tel, il s’agit pour les variables aléatoires discrètes de la moyenne pondérée des valeurs prises par la variable aléatoire où la pondération est fonction de la fréquence relative d’apparition de ces valeurs individuelles. Pour une variable aléatoire absolument continue, il s'agit de l'intégrale de valeurs x multipliée par la densité de probabilité. Les données observées peuvent être considérées comme les valeurs d'une collection de variables aléatoires indépendantes distribuées de manière identique. La moyenne de l'échantillon (ou les attentes de l'échantillon) est définie comme l'attente des données par rapport à la distribution empirique des données observées. Cela en fait simplement la moyenne arithmétique des données.


2
+1 Bonne prise: "L’attente est la valeur moyenne ou la moyenne d’une variable aléatoire et non d’une distribution de probabilité". Je n'ai pas remarqué ce mauvais usage subtile de la terminologie.
Macro

4

Portons une attention particulière aux définitions:

La moyenne est définie comme la somme d'une collection de nombres divisée par le nombre de nombres de la collection. Le calcul serait "pour i en 1 à n, (somme de x sous i) divisé par n."

La valeur attendue (EV) est la valeur moyenne à long terme des répétitions de l'expérience qu'elle représente. Le calcul serait "pour i en 1 à n, somme de l'événement x sous i fois sa probabilité (et la somme de tous les p sous i doit = ​​1)".

Dans le cas d'un dé juste, il est facile de voir que la moyenne et le VE sont les mêmes. Moyenne - (1 + 2 + 3 + 4 + 5 + 6) / 6 - 3,5 et EV seraient:

prob xp * x

0,167 1 0,17

0,167 2 0,33

0,167 3 0,50

0,167 4 0,67

0,167 5 0,83

0,167 6 1,00

EV = somme (p * x) = 3,50

Mais que se passe-t-il si les dés n'étaient pas "justes"? Un moyen facile de créer un dé injuste serait de percer un trou dans le coin, à l'intersection des 4, 5 et 6 faces. De plus, disons maintenant que la probabilité de lancer un 4, 5 ou 6 sur notre nouveau dé tordu amélioré est maintenant de 0,2 et que la probabilité de lancer un 1, 2 ou 3 est maintenant de 0,133. C'est le même dé avec 6 faces, un chiffre sur chaque face et la moyenne pour cette dé est toujours de 3,5. Cependant, après avoir lancé ce dé plusieurs fois, notre VE est maintenant de 3,8 car les probabilités pour les événements ne sont plus les mêmes pour tous les événements.

prob xp * x

0,133 1 0,13

0,133 2 0,27

0,133 3 0,40

0,200 4 0,80

0,200 5 1,00

0,200 6 1,20

EV = somme (p * x) = 3,80

Encore une fois, soyons prudents et revenons à la définition avant de conclure qu'une chose sera toujours "la même" qu'une autre. Jetez un coup d'œil à la configuration d'un dé normal, percez un trou dans les 7 autres coins et voyez comment les VE changent - amusez-vous.

Bob_T


-1

La seule différence entre "moyenne" et "valeur attendue" est que la moyenne est principalement utilisée pour la distribution de fréquence et que l'attente est utilisée pour la distribution de probabilité. Dans la distribution de fréquence, l’espace échantillon est constitué de variables et de leurs fréquences d’occurrence. Dans la distribution de probabilité, l'espace échantillon est constitué de variables aléatoires et de leurs probabilités. Nous savons maintenant que la probabilité totale de toutes les variables dans l'espace échantillon doit être = 1. Ici réside la différence fondamentale. Le terme dénominateur pour l'attente est toujours = 1. (c'est-à-dire somme f (xi) = 1) Cependant, aucune restriction de ce type sur la somme des fréquences (qui est fondamentalement le nombre total d'entrées).

En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.