Vous semblez supposer dans votre question que le concept de distribution normale existait avant l'identification de la distribution, et les gens ont essayé de comprendre ce que c'était. Je ne vois pas comment cela fonctionnerait. [Edit: il y a au moins un sens que nous pourrions considérer comme une "recherche d'une distribution" mais ce n'est pas "une recherche d'une distribution qui décrit beaucoup de phénomènes"]
Ce n'est pas le cas; la distribution était connue avant qu'on l'appelait la distribution normale.
comment prouver à une telle personne que la fonction de densité de probabilité de toutes les données normalement distribuées a la forme d'une cloche
La fonction de distribution normale est ce qui a ce qu’on appelle habituellement une "forme de cloche" - toutes les distributions normales ont la même "forme" (en ce sens qu’elles ne diffèrent que par leur échelle et leur emplacement).
Les données peuvent sembler plus ou moins «en forme de cloche» dans la distribution, mais cela ne les rend pas normales. Beaucoup de distributions non normales ont la même apparence "en forme de cloche".
La distribution réelle de la population à partir de laquelle les données sont tirées n’est probablement jamais vraiment normale, bien que ce soit parfois une approximation tout à fait raisonnable.
Ceci est généralement vrai de presque toutes les distributions que nous appliquons aux choses du monde réel - ce sont des modèles , pas des faits sur le monde. [Par exemple, si nous faisons certaines hypothèses (celles d'un processus de Poisson), nous pouvons déduire la distribution de Poisson - une distribution largement utilisée. Mais ces hypothèses sont-elles jamais exactement satisfaites? Généralement, le mieux que nous puissions dire (dans les bonnes situations) est qu’elles sont presque vraies.]
Que considérons-nous réellement comme des données normalement distribuées? Les données qui suivent le modèle de probabilité d'une distribution normale, ou autre chose?
Oui, pour être effectivement distribuée normalement, la population à partir de laquelle l'échantillon aurait été créé devrait avoir une distribution qui présente exactement la forme fonctionnelle d'une distribution normale. En conséquence, aucune population finie ne peut être normale. Les variables qui doivent nécessairement être délimitées ne peuvent pas être normales (par exemple, les temps pris pour des tâches particulières, la longueur de choses particulières ne peuvent pas être négatives et ne peuvent donc pas être distribuées normalement).
il serait peut-être plus intuitif que la fonction de probabilité de données normalement distribuées ait la forme d'un triangle isocèle
Je ne vois pas pourquoi c'est nécessairement plus intuitif. C'est certainement plus simple.
Au début de l’élaboration de modèles de distribution d’erreurs (en particulier pour l’astronomie au début de la période), les mathématiciens ont envisagé diverses formes en relation avec les distributions d’erreur (y compris une distribution triangulaire), mais dans la plupart des travaux, il s’agissait de mathématiques ( que l'intuition) qui a été utilisé. Laplace a étudié les distributions doubles exponentielles et normales (parmi plusieurs autres), par exemple. De même, Gauss a utilisé les mathématiques pour le calculer à peu près au même moment, mais par rapport à un ensemble de considérations différent de celui de Laplace.
Dans le sens étroit où Laplace et Gauss envisageaient des "distributions d'erreurs", on pourrait considérer qu'il s'agissait d'une "recherche d'une distribution", du moins pour un temps. Les deux postulaient des propriétés pour une distribution d’erreurs qu’ils considéraient importantes (Laplace considérait une séquence de critères quelque peu différents dans le temps) conduisait à des distributions différentes.
Ma question est essentiellement la suivante: pourquoi la fonction de densité de probabilité de distribution normale a-t-elle une forme de cloche et pas une autre?
La forme fonctionnelle de la chose appelée fonction de densité normale lui donne cette forme. Considérons la norme normale (pour simplifier; chaque autre normale a la même forme, ne différant que par son échelle et son emplacement):
FZ( z) = k ⋅ e- 12z2;- ∞ < z< ∞
k
X
Bien que certaines personnes aient considéré la distribution normale comme "habituelle", ce n’est vraiment que dans certains ensembles de situations que vous avez même tendance à la considérer comme une approximation.
La découverte de la distribution est généralement attribuée à de Moivre (approximation du binôme). Il a en fait dérivé la forme fonctionnelle en essayant d'approximer les coefficients binomiaux (/ probabilités binomiales) pour approcher des calculs fastidieux, mais - bien qu'il dérive effectivement la forme de la distribution normale - il ne semble pas avoir pensé à son approximation comme un distribution de probabilité, bien que certains auteurs suggèrent qu'il l'a fait. Une certaine interprétation est nécessaire afin de permettre des différences dans cette interprétation.
Gauss et Laplace y travaillèrent au début des années 1800; Gauss en écrivit en 1809 (en relation avec le fait qu'il s'agisse de la distribution pour laquelle la moyenne est la MLE du centre) et Laplace en 1810, en tant qu'approximation de la distribution des sommes de variables aléatoires symétriques. Dix ans plus tard, Laplace donne une première forme du théorème de la limite centrale, pour les variables discrètes et continues.
Les premiers noms de la distribution incluent la loi de l'erreur , la loi de la fréquence des erreurs , et il a également été nommé d'après Laplace et Gauss, parfois conjointement.
Le terme "normal" a été utilisé pour décrire la distribution indépendamment par trois auteurs différents dans les années 1870 (Peirce, Lexis et Galton), le premier en 1873 et les deux autres en 1877. Cela fait plus de soixante ans après les travaux de Gauss et Laplace et plus du double depuis l'approximation de De Moivre. Son utilisation par Galton était probablement la plus influente, mais il utilisa le terme "normal" par rapport à lui une seule fois dans cette œuvre de 1877 (l'appelant principalement "la loi de la déviation").
Cependant, dans les années 1880, Galton utilisa l'adjectif "normal" en rapport avec la distribution (par exemple, comme "courbe normale" en 1889), et influença à son tour les statisticiens britanniques (notamment Karl Pearson ). Il n'a pas expliqué pourquoi il avait utilisé le terme "normal" de cette manière, mais l'a probablement interprété dans le sens de "typique" ou "habituel".
La première utilisation explicite de l'expression "distribution normale" semble être celle de Karl Pearson; il l'utilise certainement en 1894, bien qu'il affirme l'avoir utilisé bien avant (une affirmation que je considérerais avec une certaine prudence).
Les références:
Miller, Jeff
"Premières utilisations connues de certains termes de mathématiques:"
Distribution normale (Entrée de John Aldrich)
http://jeff560.tripod.com/n.html
Stahl, Saul (2006),
"L'évolution de la distribution normale",
Mathematics Magazine , Vol. 79, n ° 2 (avril), p. 96-113
https://www.maa.org/sites/default/files/pdf/upload_library/22/Allendoerfer/stahl96.pdf
Distribution normale, (1er août 2016).
Dans Wikipedia, l'encyclopédie libre.
Récupéré le 3 août 2016 à 12 h 02 dans
https://en.wikipedia.org/w/index.php?title=Normal_distribution&oldid=732559095#History.
Hald, A (2007),
"Approximation normale de De Moivre au binôme, 1733 et sa généralisation",
dans: Une histoire de l'inférence statistique paramétrique de Bernoulli à Fisher, 1713-1935; pp 17-24
[Vous pouvez noter des divergences substantielles entre ces sources par rapport à leur compte de Moivre]