Permettez-moi de commencer par nier la prémisse. Robert Geary n'a probablement pas exagéré le cas quand il a dit (en 1947) " ... la normalité est un mythe; il n'y a jamais eu et il n'y aura jamais de distribution normale. " -
la distribution normale est un modèle *, un approximation parfois plus ou moins utile.
* (dont, voir George Box , bien que je préfère la version sur mon profil).
Le fait que certains phénomènes soient à peu près normaux n'est pas une grande surprise, car des sommes d'effets indépendants [ou même pas trop fortement corrélés] devraient, s'il y en a beaucoup et aucun n'a une variance substantielle par rapport à la variance du somme du reste que nous pourrions voir la distribution a tendance à sembler plus normale.
n
Bien sûr, si les moyennes normalisées sont approximativement normales, les sommes normalisées le seront; c'est la raison du raisonnement «somme de nombreux effets». Donc, s'il y a beaucoup de petites contributions à la variation et qu'elles ne sont pas fortement corrélées, vous pourriez avoir tendance à le voir.
Le théorème de Berry-Esseen nous donne une déclaration à ce sujet (convergence vers des distributions normales) se produisant réellement avec des moyennes d'échantillonnage normalisées pour les données iid (dans des conditions légèrement plus strictes que pour le CLT, car il exige que le troisième moment absolu soit fini), comme ainsi que de nous dire à quelle vitesse cela se produit. Les versions ultérieures du théorème traitent des composantes non identiquement distribuées dans la somme , bien que les limites supérieures de l'écart par rapport à la normalité soient moins strictes.
Moins formellement, le comportement des convolutions avec des distributions raisonnablement agréables nous donne des raisons supplémentaires (bien que étroitement liées) de soupçonner que cela pourrait avoir tendance à être une approximation juste dans des échantillons finis dans de nombreux cas. La convolution agit comme une sorte d'opérateur de "maculage" que les personnes qui utilisent l'estimation de la densité du noyau à travers une variété de noyaux seront familières; une fois que vous avez standardisé le résultat (de sorte que la variance reste constante à chaque fois que vous effectuez une telle opération), il y a une nette progression vers des formes de collines de plus en plus symétriques lorsque vous lissez à plusieurs reprises (et peu importe si vous changez le noyau à chaque fois).
Terry Tao donne une belle discussion des versions du théorème de la limite centrale et le théorème Berry-Esseen ici , et le long du chemin mentionne une approche à une version non-indépendante du Berry-Esseen.
Il y a donc au moins une catégorie de situations où nous pouvons nous attendre à le voir, et des raisons formelles de penser que cela aura vraiment tendance à se produire dans ces situations. Cependant, au mieux, tout sentiment que le résultat de "sommes de nombreux effets" sera normal est une approximation. Dans de nombreux cas, il s'agit d'une approximation tout à fait raisonnable (et dans d'autres cas, même si l'approximation de la distribution n'est pas proche, certaines procédures qui supposent la normalité ne sont pas particulièrement sensibles à la distribution des valeurs individuelles, au moins dans les grands échantillons).
Il existe de nombreuses autres circonstances où les effets ne s'ajoutent pas et nous pouvons nous attendre à ce que d'autres choses se produisent; par exemple, dans de nombreuses données financières, les effets ont tendance à être multiplicatifs (les effets déplaceront les montants en pourcentage, comme les intérêts, l'inflation et les taux de change par exemple). Là, nous ne nous attendons pas à la normalité, mais nous pouvons parfois observer une approximation approximative de la normalité sur l'échelle logarithmique. Dans d'autres situations, ni l'un ni l'autre ne peuvent être appropriés, même dans un sens approximatif. Par exemple, les temps inter-événements ne seront généralement pas bien approximés par la normalité ou la normalité des journaux; il n'y a pas de «sommes» ni de «produits» d'effets à défendre ici. Il existe de nombreux autres phénomènes sur lesquels nous pouvons plaider pour un type particulier de "loi" dans des circonstances particulières.