(Initialement publié sur MSE.)
J'ai vu de nombreuses discussions heuristiques du théorème de la limite centrale classique parler de la distribution normale (ou de n'importe laquelle des distributions stables) comme d'un "attracteur" dans l'espace des densités de probabilité. Par exemple, considérez ces phrases en haut de Wikipedia traitement :
Dans une utilisation plus générale, un théorème central limite est l'un quelconque d'un ensemble de théorèmes de convergence faible dans la théorie des probabilités. Ils expriment tous le fait qu'une somme de nombreuses variables aléatoires indépendantes et identiquement distribuées (iid), ou alternativement, des variables aléatoires avec des types de dépendance spécifiques, auront tendance à être distribuées selon l'une d'un petit ensemble de distributions d'attracteurs . Lorsque la variance des variables iid est finie, la distribution d'attracteur est la distribution normale.
Ce langage de systèmes dynamiques est très suggestif. Feller parle également d '"attraction" dans son traitement du CLT dans son deuxième volume (je me demande si c'est la source de la langue), et Yuval Flimus dans cette note parle même de "bassin d'attraction". (Je ne pense pas qu'il signifie vraiment "la forme exacte du bassin d'attraction est déductible à l'avance" mais plutôt "la forme exacte de l' attracteur est déductible à l'avance"; néanmoins, le langage est là.) Ma question est: ces les analogies dynamiques soient-elles précisées?Je ne connais aucun livre dans lequel ils se trouvent - bien que de nombreux livres tiennent à souligner que la distribution normale est spéciale pour sa stabilité sous convolution (ainsi que sa stabilité sous la transformée de Fourier). Cela nous dit essentiellement que la normale est importante car c'est un point fixe. Le CLT va plus loin en nous disant que ce n'est pas seulement un point fixe mais un attracteur.
Pour rendre cette image géométrique précise, j'imagine prendre l'espace de phase pour être un espace de fonction infini approprié (l'espace des densités de probabilité) et l'opérateur d'évolution pour être une convolution répétée avec une condition initiale. Mais je n'ai aucune idée des aspects techniques impliqués dans le fonctionnement de cette image ou si cela vaut la peine de poursuivre.
Je suppose que puisque je ne trouve pas de traitement qui poursuive cette approche explicitement, il doit y avoir quelque chose qui ne va pas avec mon sentiment que cela peut être fait ou que ce serait intéressant. Si tel est le cas, j'aimerais savoir pourquoi.
EDIT : Il y a trois questions similaires dans Math Stack Exchange et MathOverflow qui pourraient intéresser les lecteurs: