En bref: est symétrique lorsque X et 2 a - X ont la même distribution pour un certain nombre réel a . XX2 a - Xune Mais arriver à cela de manière pleinement justifiée nécessite quelques digressions et généralisations, car cela soulève de nombreuses questions implicites: pourquoi cette définition de «symétrique»? Peut-il y avoir d'autres types de symétries? Quelle est la relation entre une distribution et ses symétries, et inversement, quelle est la relation entre une "symétrie" et les distributions qui pourraient avoir cette symétrie?
Les symétries en question sont des reflets de la ligne réelle. Tous sont de la forme
x→2a−x
pour une constante .a
Supposons donc que ait cette symétrie pour au moins un a . Ensuite, la symétrie impliqueXa
Pr[X≥a]=Pr[2a−X≥a]=Pr[X≤a]
montrant que est une médiane de X . De même, si X a une attente, il s'ensuit immédiatement que a = E [ X ] . Ainsi, nous pouvons généralement identifier facilement un . Même si ce n'est pas le cas, a (et donc la symétrie elle-même) est toujours déterminée de manière unique (si elle existe).aXXa=E[X]aa
Pour voir cela, soit tout centre de symétrie. En appliquant ensuite les deux symétries, nous voyons que X est invariant sous la translation x → x + 2 ( b - a ) . Si b - a ≠ 0 , la distribution de X doit avoir une période de b - a , ce qui est impossible car la probabilité totale d'une distribution périodique est soit 0 soit infinie. Ainsi b - a = 0 , montrant que a est unique.bX x→x+2(b−a)b−a≠0Xb−a0b−a=0a
Plus généralement, lorsque est un groupe agissant fidèlement sur la ligne réelle (et par extension sur tous ses sous-ensembles Borel), on pourrait dire qu'une distribution X est "symétrique" (par rapport à G ) lorsqueGXG
Pr[X∈E]=Pr[X∈Eg]
pour tous les ensembles mesurables et les éléments g ∈ G , où E g désigne l'image de E sous l'action de g .Eg∈GEgEg
Par exemple, soit toujours un groupe d'ordre 2 , mais maintenant son action consiste à prendre l'inverse d'un nombre réel (et à fixer 0 ). La distribution lognormale standard est symétrique par rapport à ce groupe. Cet exemple peut être compris comme un exemple de symétrie de réflexion où une ré-expression non linéaire des coordonnées a eu lieu. Cela suggère de se concentrer sur les transformations qui respectent la "structure" de la ligne réelle. La structure essentielle à la probabilité doit être liée aux ensembles de Borel et à la mesure de Lebesgue, qui peuvent tous deux être définis en termes de distance (euclidienne) entre deux points.G20
Une carte préservant la distance est, par définition, une isométrie. Il est bien connu (et facile, quoique un peu compliqué, de le démontrer) que toutes les isométries de la ligne réelle sont générées par des réflexions. D'où, lorsqu'on comprend que "symétrique" signifie symétrique par rapport à un groupe d'isométries , le groupe doit être généré par au plus une réflexion et nous avons vu que la réflexion est uniquement déterminée par toute distribution symétrique par rapport à elle. En ce sens, l'analyse précédente est exhaustive et justifie la terminologie habituelle des distributions "symétriques".
Soit dit en passant, une multitude d' exemples multivariés de distributions invariantes sous des groupes d'isométries est fourni en considérant les distributions "sphériques". Celles-ci sont invariantes sous toutes les rotations (par rapport à un centre fixe). Celles-ci généralisent le cas unidimensionnel: les "rotations" de la ligne réelle ne sont que les réflexions.
Enfin, il convient de souligner qu'une construction standard - faisant la moyenne sur le groupe - permet de produire des charges de distributions symétriques. Dans le cas de la droite réelle, soit généré par la réflexion autour d'un point a , de sorte qu'il soit constitué de l'élément d'identité e et de cette réflexion, g . Laissez X soit une distribution. Définissez la distribution Y en définissantGaegXY
PrY[E]=1|G|∑g∈GPrX[Eg]=(PrX[E]+PrX[Eg])/2
pour tous les ensembles Borel . C'est manifestement symétrique et il est facile de vérifier qu'elle reste une distribution (toutes les probabilités restent non négatives et la probabilité totale est 1 ).E1
Illustrant le processus de moyenne de groupe, le PDF d'une distribution gamma symétrisée (centrée sur ) est représenté en or. Le Gamma d'origine est en bleu et son reflet est en rouge.a=2