Statistiques suffisantes communément complètes: uniformes (a, b)


13

Soit un échantillon aléatoire de la distribution uniforme sur , où a <b . Soit Y_1 et Y_n les statistiques de commande les plus grandes et les plus petites. Montrer que la statistique (Y_1, Y_n) est une statistique suffisante complétée conjointement pour le paramètre \ theta = (a, b) . X=(x1,x2,xn)(a,b)a<bY1Yn(Y1,Yn)θ=(a,b)

Ce n'est pas un problème pour moi de démontrer la suffisance en utilisant la factorisation.

Question: Comment montrer l'intégralité? De préférence, je voudrais un indice.

Tentative: je peux afficher E[g(T(x))]=0 implique g(T(x))=0 pour la distribution uniforme à un paramètre, mais je suis bloqué sur la distribution uniforme à deux paramètres.

J'ai essayé de jouer avec E[g(Y1,Yn)] et d'utiliser la distribution conjointe de Y1 et Yn , mais je ne sais pas si je vais dans la bonne direction, car le calcul me fait trébucher.


1
Veuillez ajouter la [self-study]balise et lire son wiki . Notez que vous pouvez utiliser le formatage Latex pour les mathématiques en mettant des dollars autour, par exemple $x$produit x . J'ai essayé de composer certains de vos calculs, mais n'hésitez pas à changer ou à revenir si vous n'êtes pas satisfait du résultat. Vous pouvez préférer la notation $\vec x$pour x au lieu de $\mathbf x$pour x .
Silverfish

Réponses:


7

Prenons soin du calcul de routine pour vous, afin que vous puissiez aller au cœur du problème et profiter de la formulation d'une solution. Cela revient à construire des rectangles comme des unions et des différences de triangles.

Tout d'abord, choisissez les valeurs de et qui rendent les détails aussi simples que possible. ab J'aime : la densité univariée de n'importe quelle composante de n'est que la fonction indicatrice de l'intervalle .a=0,b=1X=(X1,X2,,Xn)[0,1]

Trouvons la fonction de distribution de . F(Y1,Yn)Par définition, pour tout nombre réel c'esty1yn

(1)F(y1,yn)=Pr(Y1y1 and Ynyn).

Les valeurs de sont évidemment ou au cas où l'un de ou est en dehors de l'intervalle , supposons donc qu'ils sont tous les deux dans cet intervalle. (Supposons également pour éviter de discuter de trivialités.) Dans ce cas, l'événement peut être décrit en termes de variables d'origine comme "au moins l'un des est inférieur ou égal à et aucun des dépasse . " De manière équivalente, tous les se trouvent dansF01y1yn[a,b]=[0,1]n2(1)X=(X1,X2,,Xn)Xiy1XiynXi[0,yn]mais ce n'est pas le cas que tous se trouvent dans . (y1,yn]

Parce que les sont indépendants, leurs probabilités se multiplient et donnent et , respectivement, pour ces deux événements qui viennent d'être mentionnés. Donc,Xi(yn0)n=ynn(yny1)n

F(y1,yn)=ynn(yny1)n.

La densité est la dérivée partielle mixte de ,fF

f(y1,yn)=2Fy1yn(y1,yn)=n(n1)(yny1)n2.

Le cas général pour échelle les variables selon le facteur et déplace l'emplacement de . (a,b)baa Ainsi, pour ,a<y1yn<b

F(y1,yn;a,b)=((ynaba)n(ynabay1aba)n)=(yna)n(yny1)n(ba)n.

Différencier comme avant

f(y1,yn;a,b)=n(n1)(ba)n(yny1)n2.

Considérez la définition de l'exhaustivité. Soit toute fonction mesurable de deux variables réelles. Par définition,g

(2)E[g(Y1,Yn)]=y1babg(y1,yn)f(y1,yn)dy1dyny1babg(y1,yn)(yny1)n2dy1dyn.

Nous devons montrer que lorsque cette attente est nulle pour tous , alors il est certain que pour tout .(a,b)g=0(a,b)

Voici votre indice. Laissez soit une fonction mesurable. Je voudrais l'exprimer sous la forme suggérée par comme . Pour ce faire, il faut évidemment diviser par . Malheureusement, pour cela n'est pas défini chaque fois que . La clé est que cet ensemble a une mesure zéro, nous pouvons donc le négliger.h:R2R(2)h(x,y)=g(x,y)(yx)n2h(yx)n2n>2yx

En conséquence, étant donné tout mesurable , définirh

g(x,y)={h(x,y)/(yx)n2xy0x=y

Alors devient(2)

(3)y1babh(y1,yn)dy1dynE[g(Y1,Yn)].

(Lorsque la tâche montre que quelque chose est nul, nous pouvons ignorer des constantes de proportionnalité non nulles. Ici, j'ai supprimé du côté gauche.)n(n1)/(ba)n2

Il s'agit d'une intégrale sur un triangle rectangle avec l'hypoténuse s'étendant de à et le sommet en . Notons un tel triangle .(a,a)(b,b)(a,b)Δ(a,b)

Ergo , ce que vous devez montrer, c'est que si l'intégrale d'une fonction mesurable arbitraire sur tous les triangles est nulle, alors pour tout , (presque sûrement ) pour tous .hΔ(a,b)a<bh(x,y)=0(x,y)Δ(a,b)

Bien qu'il puisse sembler que nous ne soyons pas allés plus loin, considérons tout rectangle entièrement contenu dans le demi-plan . Il peut être exprimé en termes de triangles:[u1,u2]×[v1,v2]y>x

[u1,u2]×[v1,v2]=Δ(u1,v2)(Δ(u1,v1)Δ(u2,v2))Δ(u2,v1).

Figure montrant les trois triangles se chevauchant pour produire le rectangle

Dans cette figure, le rectangle est ce qui reste du grand triangle lorsque nous supprimons les triangles rouges et verts qui se chevauchent (qui comptent deux fois leur intersection brune) puis remplaçons leur intersection.

Par conséquent, vous pouvez immédiatement déduire que l'intégrale de sur tous ces rectangles est nulle. h Il ne reste plus qu'à montrer que doit être nul (à part ses valeurs sur un ensemble de mesure zéro) chaque fois que . La preuve de cette affirmation (intuitivement claire) dépend de l'approche que vous souhaitez adopter pour la définition de l'intégration.h(x,y)y>x


J'ai essayé de mettre l'équation 3 égale à zéro, de prendre la dérivée des deux côtés et d'échanger les signes (une action réflexe je suppose) mais les résultats semblent assez effrayants [1]. Existe-t-il une approche plus raisonnable? [1] en.wikipedia.org/wiki/Leibniz_integral_rule#Higher_dimensions
mugen

1
Considérez des collections finies de triangles de plus en plus petits qui se trouvent tous le long de l'hypoténuse dans l'image et prenez la limite lorsque le diamètre du plus grand triangle de la collection devient nul.
whuber
En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.