Ce n'est pas une preuve (et +1 à la réponse de @ whuber), mais c'est une manière géométrique de construire une intuition sur la raison pour laquelle est un réponse sensée.E(X1|T)=T/n
Soit et donc . Nous conditionnons ensuite sur l'événement que pour certains , donc c'est comme dessiner des Gaussiens multivariés supportés sur mais en ne regardant que ceux qui se retrouvent dans l'affine espace . Ensuite, nous voulons connaître la moyenne des coordonnées des points qui atterrissent dans cet espace affine (sans parler du fait qu'il s'agit d'un sous-ensemble de mesure zéro).X=(X1,…,Xn)T1=(1,…,1)TT=1TX1TX=tt∈RRn{x∈Rn:1Tx=t}x1
Nous connaissons
X∼N(μ1,I)
, nous avons donc une gaussienne sphérique avec un vecteur moyen constant, et le vecteur moyen μ1 est sur la même ligne que le vecteur normal de l'hyperplan xT1=0 .
Cela nous donne une situation comme l'image ci-dessous:
L'idée clé: imaginez d'abord la densité sur le sous-espace affine Ht:={x:xT1=t} . La densité de X est symétrique autour de x1=x2 puisque E(X)∈span 1 . La densité sera également symétrique sur Ht car Ht est également symétrique sur la même ligne, et le point autour duquel elle est symétrique est l'intersection des lignes x1+x2=t etx1=x2 . Cela se produit pourx=(t/2,t/2) .
Pour imaginer E(X1|T) nous pouvons imaginer échantillonner encore et encore, puis chaque fois que nous obtenons un point dans Ht nous prenons juste la coordonnée x1 et l'enregistrons. À partir de la symétrie de la densité sur Ht la distribution des coordonnées x1 sera également symétrique, et elle aura le même point central de t/2 . La moyenne d'une distribution symétrique est le point central de symétrie donc cela signifie E(X1|T)=T/2, et que E(X1|T)=E(X2|T) puisque X1 et X2 peuvent être échangés sans rien affecter.
Dans des dimensions plus élevées, cela devient difficile (ou impossible) à visualiser exactement, mais la même idée s'applique: nous avons un gaussien sphérique avec une moyenne dans l'intervalle de 1 , et nous examinons un sous-espace affine qui est perpendiculaire à cela. Le point d'équilibre de la distribution sur le sous-espace sera toujours l'intersection de la span 1 et {x:xT1=t} qui est à x=(t/n,…,t/n) , et la densité est toujours symétrique donc ce point d'équilibre est à nouveau la moyenne.
Encore une fois, ce n'est pas une preuve, mais je pense que cela donne une idée décente de la raison pour laquelle vous vous attendez à ce comportement en premier lieu.
Au-delà de cela, comme certains l'ont noté @StubbornAtom, cela ne nécessite pas réellement que X soit gaussien. En 2D, notez que si X est échangeable, alors f(x1,x2)=f(x2,x1) (plus généralement, f(x)=f(xσ) ) donc f doit être symétrique sur la ligne x1=x2 . Nous avons également E(X)∈span 1 donc tout ce que j'ai dit concernant "l'idée clé" dans la première image est toujours valable. Voici un exemple où lesXi sont iid à partir d'un modèle de mélange gaussien. Toutes les lignes ont la même signification que précédemment.