Ces deux distributions sont différentes pour tout .n ≥ 4
Notation
Je vais redimensionner votre simplexe d'un facteur , de sorte que les points du réseau aient des coordonnées entières. Cela ne change rien, je pense juste que cela rend la notation un peu moins lourde.n
Soit le ( n - 1 ) -simplex, donné comme la coque convexe des points ( n , 0 , … , 0 ) , ..., ( 0 , … , 0 , n ) dans R n . En d'autres termes, ce sont les points où toutes les coordonnées sont non négatives et où la somme des coordonnées est égale à n .S( n - 1 )( n , 0 , … , 0 )( 0 , … , 0 , n )Rnn
Soit l'ensemble des points du réseau , c'est-à-dire les points en S où toutes les coordonnées sont intégrales.ΛS
Si est un point de réseau, nous laissons V P désigner sa cellule de Voronoï , définie comme les points de S qui sont (strictement) plus proches de P que de tout autre point de Λ .PVPSPΛ
Nous mettons deux distributions de probabilité que nous pouvons mettre sur . La première est la distribution multinomiale, où le point ( un 1 , . . . , Un n ) a la probabilité 2 - n n ! / ( a 1 ! ⋯ a n ! ) . L'autre nous appellerons le modèle Dirichlet , et il attribue à chaque P ∈ X une probabilité proportionnelle au volume de V P .Λ( un1, . . . , unn)2- nn ! / ( a1! ⋯ an! )P∈ ΛVP
Justification très informelle
Je prétends que le modèle multinomial et le modèle de Dirichlet donnent des distributions différentes sur , chaque fois que n ≥ 4 .Λn ≥ 4
Pour voir cela, considérons le cas , et les points A = ( 2 , 2 , 0 , 0 ) et B = ( 3 , 1 , 0 , 0 ) . Je prétends que V A et V B sont congruents via une translation par le vecteur ( 1 , - 1 , 0 , 0 ) . Cela signifie que V A et V Bn = 4A = ( 2 , 2 , 0 , 0 )B = ( 3 , 1 , 0 , 0 )VUNEVB(1,−1,0,0)VAVBont le même volume, et donc que et B ont la même probabilité dans le modèle de Dirichlet. En revanche, dans le modèle multinomial, elles ont des probabilités différentes ( 2 - 4 ⋅ 4 ! / ( 2 ! 2 ! ) Et 2 - 4 ⋅ 4 ! / 3 ! ), Et il s'ensuit que les distributions ne peuvent pas être égales.AB2−4⋅4!/(2!2!)2−4⋅4!/3!
Le fait que et V B sont congruents découle de l'affirmation plausible mais non évidente (et quelque peu vague) suivante:VAVB
Allégation plausible : la forme et la taille de ne sont affectées que par les "voisins immédiats" de P , (c'est-à-dire les points dans Λ qui diffèrent de P par un vecteur qui ressemble ( 1 , - 1 , 0 , … , 0 ) , où le 1 et le - 1 peuvent être ailleurs)VPPΛP( 1 , - 1 , 0 , … , 0 )1- 1
Il est facile de voir que les configurations des "voisins immédiats" de et B sont les mêmes, et il s'ensuit alors que V A et V B sont congruents.UNEBVUNEVB
Dans le cas , on peut jouer le même jeu, avec A = ( 2 , 2 , n - 4 , 0 , … , 0 ) et B = ( 3 , 1 , n - 4 , 0 , … , 0 ) , par exemple.n ≥ 5A = ( 2 , 2 , n - 4 , 0 , … , 0 )B = ( 3 , 1 , n - 4 , 0 , … , 0 )
Je ne pense pas que cette affirmation soit complètement évidente, et je ne vais pas le prouver, au lieu d'une stratégie légèrement différente. Cependant, je pense que c'est une réponse plus intuitive pour expliquer pourquoi les distributions sont différentes pour .n ≥ 4
Une preuve rigoureuse
Prenez et B comme dans la justification informelle ci-dessus. Il suffit de prouver que V A et V B sont congruents.UNEBVUNEVB
Étant donné , nous définirons W P comme suit: W P est l'ensemble des points ( x 1 , … , x n ) ∈ S , pour lesquels max 1 ≤ i ≤ n ( a i - p i ) - min 1 ≤ i ≤ n ( a iP= ( p1, … , Pn) ∈ ΛWPWP( x1, … , Xn) ∈ S . (De manière plus digestible: Soit v i = a i - p i . W P est l'ensemble des points pour lesquels la différence entre le plus haut et le plus bas v i est inférieure à 1.)max1≤i≤n(ai−pi)−min1≤i≤n(ai−pi)<1vje= aje- pjeWPvje
Nous allons montrer que .VP= WP
Étape 1
Revendication: .VP⊆ WP
Ceci est assez facile: Supposons que est pas en W P . Soit v i = x i - p i , et supposons (sans perte de généralité) que v 1 = max 1 ≤ i ≤ n v i , v 2 = min 1 ≤ i ≤ n v i . v 1 - v 2X= ( x1, … , Xn)WPvje= xje- pjev1= max1 ≤ i ≤ nvjev2= min1 ≤ i ≤ nvje Puisque ∑ n i = 1 v i = 0 , nous savons également que v 1 > 0 > v 2 .v1- v2≥ 1∑ni = 1vje= 0v1> 0 > v2
Soit maintenant . Puisque P et X ont tous deux des coordonnées non négatives, il en est de même de Q , et il s'ensuit que Q ∈ S , et donc Q ∈ Λ . Par contre, d i s t 2 ( X , P ) - d i s t 2Q = ( p1+ 1 , p2- 1 , p3, … , Pn)PXQQ ∈ SQ ∈ Λ . Ainsi, X est au moins aussi proche de Q à P ,sorte que X ∉ V P . Cela montre (en prenant des compléments) qued i s t2( X, P) - d i s t2( X,Q)=v21+v22−(1−v1)2−(1+v2)2=−2+2(v1−v2)≥0XQPX∉VP .Vp⊆WP
Étape 2
Affirmation : Les sont disjoints deux à deux.WP
Supposons le contraire. Soient et Q = ( q 1 , ... , q n ) soient des points distincts en Λ , et que X ∈ W P ∩ W Q . Puisque P et Q sont distincts et tous deux dans Λ , il doit y avoir un indice i où p i ≥ q i + 1 et un oùP=(p1,…,pn)Q=(q1,…,qn)ΛX∈WP∩WQPQΛipi≥qi+1 . Sans perte de généralité, nous supposons que p 1 ≥ q 1 + 1 et p 2 ≤ q 2 - 1 . En réorganisant et en additionnant, nous obtenons q 1 - p 1 + p 2 - q 2 ≥ 2 .pi≤qi−1p1≥q1+1p2≤ q2- 1q1- p1+ p2- q2≥ 2
Considérez maintenant les nombres et x 2 . Du fait que X ∈ W P , nous avons x 1 - p 1 - ( x 2 - p 2 ) < 1 . De même, X ∈ W Q implique que x 2 - q 2 - ( x 1 - q 1 ) < 1 . En les additionnant ensemble, nous obtenons q 1 - pX1X2X∈ WPX1- p1- ( x2- p2) < 1X∈ WQX2- q2- ( x1- q1) < 1 , et nous avons une contradiction.q1- p1+ p2- q2< 2
Étape 3
Nous avons montré que , et que les W P sont disjoints. Le V P couvre S jusqu'à un ensemble de mesure zéro, et il s'ensuit que W P = V P (jusqu'à un ensemble de mesure zéro). [Puisque W P et V P sont tous deux ouverts, nous avons en fait W P = V P exactement, mais ce n'est pas essentiel.]VP⊆ WPWPVPSWP= VPWPVPWP= VP
Maintenant, nous avons presque terminé. Considérons les points et B = ( 3 , 1 , n - 4 , 0 , … , 0 ) . Il est facile de voir que W A et W B sont congruents et se traduisent l'un l'autre: la seule façon dont ils pourraient différer, c'est si la frontière de S (autre que les faces sur lesquelles AA = ( 2 , 2 , n - 4 , 0 , … , 0 )B = ( 3 , 1 , n - 4 , 0 , … , 0 )WUNEWBSUNEet mentent tous les deux) `` couperaient '' W A ou W B mais pas l'autre. Mais pour atteindre une telle partie de la frontière de S , nous aurions besoin de changer une coordonnée de A ou B d'au moins 1, ce qui serait suffisant pour garantir de nous sortir de W A et W B de toute façon. Ainsi, même si S semble différent des points de vue A et B , les différences sont trop éloignées pour être captées par les définitions de W A et W B , et donc WBWUNEWBSUNEBWUNEWBSUNEBWUNEWB et W B sont congruents.WUNEWB
Il s'ensuit alors que et V B ont le même volume, et donc le modèle de Dirichlet leur attribue la même probabilité, même s'ils ont des probabilités différentes dans le modèle multinomial.VUNEVB