Pourquoi les distributions moyenne 0 et écart type 1 sont-elles toujours utilisées?


15

Mes statistiques ont été autodidactes, mais beaucoup de documents que j'ai lus indiquent un ensemble de données ayant une moyenne de 0 et un écart-type de 1.

Si tel est le cas, alors:

  1. Pourquoi la moyenne 0 et SD 1 sont-elles une belle propriété?

  2. Pourquoi une variable aléatoire tirée de cet échantillon est-elle égale à 0,5? La chance de tirer 0,001 est la même que 0,5, donc cela devrait être une distribution plate ...

  3. Lorsque les gens parlent des scores Z, que signifient-ils réellement ici?

Réponses:


11
  1. Au début, la réponse la plus utile est probablement que la moyenne de 0 et sd de 1 sont mathématiquement pratiques. Si vous pouvez calculer les probabilités pour une distribution avec une moyenne de 0 et un écart type de 1, vous pouvez les calculer pour toute distribution similaire de scores avec une équation très simple.

  2. Je ne suis pas en train de suivre cette question. La moyenne de 0 et l'écart type de 1 s'appliquent généralement à la distribution normale standard, souvent appelée courbe en cloche. La valeur la plus probable est la moyenne et elle diminue à mesure que vous vous éloignez. Si vous avez une distribution vraiment plate, il n'y a pas de valeur plus probable qu'une autre. Votre question ici est mal formulée. Étiez-vous à la recherche de questions sur les lanceurs de pièces? Recherchez la distribution binomiale et le théorème de la limite centrale.

  3. "signifie ici"? Où? La réponse simple pour les z-scores est que ce sont vos scores mis à l'échelle comme si votre moyenne était de 0 et l'écart-type était 1. Une autre façon de penser est qu'il faut un score individuel comme le nombre d'écarts-types que le score est de la signifier. L'équation calcule le (score - moyenne) / écart type. Les raisons pour lesquelles vous le feriez sont assez variées, mais l'une est que dans les cours de statistiques d'introduction, vous avez des tables de probabilités pour différents scores Z (voir réponse 1).

Si vous recherchiez d'abord le score z, même dans wikipedia, vous auriez obtenu de très bonnes réponses.


Sur 2) je crois que la confusion est ce que p (X = .01) signifie quand X est une variable aléatoire continue. Intuitivement, la probabilité semble être nulle partout car il n'y a aucune chance que X soit exactement 0,01. Le questionneur devrait revoir la définition d'une fonction de densité dans le cas continu, qui est définie comme la dérivée de la fonction de densité cumulative.
Tristan

7

Pour commencer, ce dont nous parlons ici est la distribution normale standard, une distribution normale avec une moyenne de 0 et un écart-type de 1. Le raccourci pour une variable qui est distribuée comme une distribution normale standard est Z.

Voici mes réponses à vos questions.

(1) Je pense qu'il y a deux raisons principales pour lesquelles les distributions normales standard sont attrayantes. Premièrement, toute variable normalement distribuée peut être convertie ou transformée en une normale standard en soustrayant sa moyenne de chaque observation avant de diviser chaque observation par l'écart-type. C'est ce qu'on appelle la transformation Z ou la création de scores Z. C'est très pratique surtout dans les jours précédant les ordinateurs.

(Xje-X¯)σX=Z(75-65,6)10.2=0,9215

La deuxième raison pour laquelle la distribution normale standard est fréquemment utilisée est due à l'interprétation fournie en termes de Z-scores. Chaque "observation" dans une variable transformée en Z correspond au nombre d'écarts-types de l'observation non transformée d'origine par rapport à la moyenne. Ceci est particulièrement pratique pour les tests standardisés où les performances brutes ou absolues sont moins importantes que les performances relatives.

(2) Je ne vous suis pas ici. Je pense que vous pouvez être confus quant à ce que nous entendons par une fonction de distribution cumulative. Notez que la valeur attendue d'une distribution normale standard est 0, et cette valeur correspond à la valeur de 0,5 sur la fonction de distribution cumulative associée.

(Xje-X¯)σX=Z(75-65,6)10.2=0,9215

1

Puisque vous avez reçu d'excellentes explications de Graham et John, je vais juste répondre à votre dernière question:

Lorsque les gens parlent des scores Z, que signifient-ils réellement ici?

μσ

Donc: (65-80) / 5 = -3

Vous pouvez dire que le score z pour la 65e année est de -3 ; ou en d'autres termes 3 écart-type vers la gauche.

En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.