La distribution normale ne semble pas intuitive jusqu'à ce que vous appreniez le CLT, ce qui explique pourquoi il est si répandu dans la vie réelle. Mais apparaît-elle jamais comme la distribution "naturelle" d'une certaine quantité?
La distribution normale ne semble pas intuitive jusqu'à ce que vous appreniez le CLT, ce qui explique pourquoi il est si répandu dans la vie réelle. Mais apparaît-elle jamais comme la distribution "naturelle" d'une certaine quantité?
Réponses:
Dans une certaine mesure, je pense que cela peut être une question philosophique autant que statistique.
De nombreux phénomènes naturels se répartissent approximativement normalement. On peut se demander si la cause sous - jacente de cela peut être quelque chose comme le CLT:
La taille des personnes peut être considérée comme la somme de nombreuses causes plus petites (peut-être indépendantes, probablement réparties de manière identique): longueurs de divers os, ou résultats de diverses expressions génétiques, ou résultats de nombreuses influences alimentaires, ou une combinaison de tous les éléments ci-dessus .
Les scores aux tests peuvent être considérés comme la somme des scores de nombreuses questions de test individuelles (éventuellement réparties de manière identique, peu probable entièrement indépendantes).
Distance parcourue par une particule dans une dimension à la suite d' un mouvement brownien dans un fluide: le mouvement peut être considéré de manière abstraite comme une marche aléatoire résultant de coups aléatoires d'IID par des molécules.
Un exemple où le CLT n'est pas nécessairement impliqué est la dispersion des tirs autour d'un oeil de boeuf: la distance de l'oeil de boeuf peut être modélisée comme une distribution de Rayleigh (proportionnelle à la racine carrée du chi carré avec 2 DF) et l'angle dans le sens antihoraire de l'axe horizontal positif peut être modélisé comme uniforme surEnsuite, après avoir changé de coordonnées polaires en coordonnées rectangulaires, les distances dans les directions horizontale (x) et verticale (y) se révèlent être des normales bivariées non corrélées. [C'est l'essence de la transformation Box-Muller, que vous pouvez google.] Cependant, les coordonnées x et y normales peuvent être considérées comme la somme de nombreuses petites inexactitudes dans le ciblage, ce qui pourrait justifier un mécanisme lié au CLT en arrière-plan .
Dans un sens historique, l'utilisation répandue de distributions normales (gaussiennes) au lieu de distributions double exponentielles (Laplace) pour modéliser les observations astronomiques peut être en partie due au CLT. Au début des erreurs de modélisation de telles observations, il y a eu un débat entre Gauss et Laplace , chacun plaidant pour sa propre distribution préférée. Pour diverses raisons, le modèle normal a gagné. On peut soutenir qu'une des raisons du succès éventuel de la distribution normale était la commodité mathématique basée sur les limites normales de la CLT. Cela semble être vrai même quand on ne sait pas quelle famille de distributions offre le meilleur ajustement. (Même maintenant, il y a encore des astronomes qui estiment que la "meilleure observation"faites par un astronome méticuleux et respecté est forcément de meilleure valeur que la moyenne de nombreuses observations faites par des observateurs sans doute moins doués. En fait, ils ne préféreraient aucune intervention des statisticiens.)
De nombreuses variables naturelles sont normalement distribuées. Hauteurs des humains? Taille des colonies animales?
rnorm(1)
. Idem pour toutes les distributions, autres que multinomiales.