Quel est le résultat le plus puissant sur le maximum de gaussiens iid? Le plus utilisé en pratique?


9

Étant donné iid, considérons les variables aléatoiresX1,,Xn,N(0,1)

Zn:=max1inXi.

Question: Quel est le résultat le plus "important" de ces variables aléatoires?

Pour clarifier "l'importance", quel résultat a le plus d'autres résultats comme conséquence logique? Lequel des résultats est utilisé le plus souvent dans la pratique?

Plus précisément, il semble que les statisticiens (théoriciens) connaissent le folklore que les Zn sont "fondamentalement les mêmes que" 2logn , du moins asymptotiquement. (Voir cette question connexe .)

Cependant, il existe de nombreux résultats connexes de ce type, et il semble que la plupart ne soient pas équivalents, ni ne s'impliquent les uns les autres. Par exemple ,

(1)Zn2logna.s.1,

ce qui, sinon rien, implique également les résultats correspondants en probabilité et distribution.

Cependant, cela n'implique même pas des résultats apparemment liés (voir cette autre question ), comme

(2)limnEZn2logn=1,

(c'est l'exercice 2.17 à la p. 49 de ), ou un autre résultat folklorique :

(3)EZn=2logn+Θ(1).

Non asymptotiquement, on sait également que pour chaque (voir ici pour une preuve),n

(4)clognEZn2logn

pour certains petits . Des résultats similaires peuvent également être affichés pour, puisque est fortement asymétrique à droite.c|Zn|Zn

La preuve de ce dernier résultat est beaucoup plus simple que les preuves des autres résultats. J'espérais que le premier résultat asymptotique aurait impliqué tous les autres résultats asymptotiques, afin que je puisse me sentir confiant en me concentrant tout mon temps et mon énergie à comprendre ce résultat. Mais, encore une fois, cela n'est apparemment pas vrai , alors maintenant je ne sais pas sur quoi je dois me concentrer.

Voir pp. 265-267 de la deuxième édition de Galambos, The Asymptotic Theory of Extreme Order Statistics , imprimé en 1987. Il est probablement également mentionné quelque part dans la première édition.

Boucheron, Lugosi, Massart, Inégalités de concentration: une théorie non asymptotique de l'indépendance . À part: Ce livre cite en fait Galambos pour le résultat en question, mais je ne le trouve mentionné nulle part dans Galambos - seulement le premier résultat que j'ai mentionné.


1
Savez-vous que lorsque vous utilisez \ dots dans MathJax, le résultat apparaît parfois comme si vous aviez utilisé \ ldots et parfois comme si vous aviez utilisé \ cdots, selon le contexte? J'ai remplacé \ dots par \ ldots dans cette question.
X_1, \dots, X_n, \dots \sim \mathscr{N}(0,1)X1,,Xn,N(0,1)X_1, \ldots, X_n, \ldots \sim \mathscr{N}(0,1)X1,,Xn,N(0,1)
Michael Hardy

@MichaelHardy Oh, je pensais que c'était toujours centré. Merci pour le correctif!
Chill2Macht

Réponses:


4

Dans toute application probabiliste, l'objet le plus fondamental est la distribution, les moments et les propriétés limites pouvant en être dérivés. Par conséquent, le résultat le plus "important", dans le sens que vous avez décrit, est la fonction de distribution complète (de manière équivalente, la fonction de densité correspondante). En pratique, ce résultat distributionnel est peut-être moins éclairant que certaines des propriétés asymptotiques les plus élémentaires que vous avez déjà énumérées. Bien que cela implique logiquement ces résultats asymptotiques, à mon avis, ces résultats sont susceptibles d'être plus éclairants pour comprendre la nature changeante de la valeur extrême lorsque nous modifions .FZn(z)=Φn(z)n

Il ressort clairement de votre question que vous avez une bonne compréhension des propriétés des valeurs extrêmes dans le cas d'un maximum de variables aléatoires normales standard d'IID. Ces propriétés sont toutes logiquement dérivables de la fonction de distribution pour , c'est donc l'objet le plus fondamental à l'œuvre dans ce problème. Comme dans de nombreux cas, l'objet le plus fondamental n'est pas nécessairement le plus éclairant, et vous constaterez donc probablement que vous devez vous contenter de connaître tous les résultats et de savoir qu'ils éclairent différents aspects du problème.Zn


Merci pour cette réponse - je l'apprécie. Connaissez-vous une référence pour savoir comment dériver toutes ces propriétés de la fonction de distribution pour ? J'ai eu beaucoup de mal à trouver quoi que ce soit qui explique cela, parce que tout cela est soit du «folklore», soit «à la main». Zn
Chill2Macht

Pour mémoire, j'ai lu les liens et ils n'aident pas. C'est pourquoi j'ai posé la question.
Chill2Macht

1
Je n'ai pas de référence spécifique à recommander, mais je pense que ces résultats seraient dérivés dans des livres sur la théorie des valeurs extrêmes. Je vous suggère de commencer par chercher des textes de niveau supérieur sur ce sujet et de voir si vous pouvez y trouver les dérivations.
Ben - Réintègre Monica

1

WIP: Travaux en cours

Après p. 370 des méthodes mathématiques de statistique de Cramer de 1946 , définissentIci est la fonction de distribution cumulative de la distribution normale standard, . En conséquence de sa définition, nous sommes assurés que presque sûrement.

Ξn=n(1Φ(Zn)).
ΦN(0,1)0Ξnn

Considérons une réalisation donnée de notre espace échantillon. Dans ce sens, est donc à la fois une fonction de et , et une fonction de et . Pour un fixe , nous pouvons considérer une fonction déterministe de , et une fonction déterministe de et , simplifiant ainsi le problème. Notre objectif est de montrer des résultats qui valent pour presque tous lesωΩZnnωΞnZn,nωωZnnΞnZnnωΩ, ce qui nous permet de transférer nos résultats d'une analyse non déterministe au cadre non déterministe.

Après p. 374 de Cramer 1946 Mathematical Methods of Statistics, supposons pour le moment (je vise à revenir et à fournir une preuve plus tard) que nous sommes en mesure de montrer que (pour tout ) l'expansion asymptotique suivante tient (en utilisant intégration par parties et définition de ):ωΩΦ

(~)2πnΞn=1ZneZn22(1+O(1Zn2))  as  Zn.

Clairement, nous avons que pour tout , et est presque sûrement une fonction croissante de comme , donc nous affirmons dans ce qui suit tout au long de cela (presque sûrement tous) fixe :Zn+1ZnnZnnnω

Znn.

Il s'ensuit donc que nous avons (où dénote l'équivalence asymptotique ):

2πnΞn1Zne1Zn2  as  Znn.

La façon dont nous procédons dans ce qui suit revient essentiellement à la méthode de l'équilibre dominant , et nos manipulations seront formellement justifiées par le lemme suivant:

Lemme: Supposons que comme , et (donc ). Etant donné toute fonction qui est formée via des compositions, des additions et des multiplications de logarithmes et de lois de puissance (essentiellement n'importe quelle fonction " polylog "), nous devons également avoir cela comme :En d'autres termes, de telles fonctions "polylog" préservent l'équivalence asymptotique .f(n)g(n)nf(n)g(n)hn h ( f ( n ) ) h ( g ( n ) )n

h(f(n))h(g(n)).

La vérité de ce lemme est une conséquence du théorème 2.1. comme écrit ici . Notez également que ce qui suit est principalement une version étendue (plus de détails) de la réponse à une question similaire trouvée ici .

En prenant des logarithmes des deux côtés, nous obtenons que:

(1)log(2πΞn)lognlogZnZn22.

C'est là que Cramer est quelque peu méfiant; il dit simplement "en supposant que est borné", nous pouvons conclure bla bla bla. Mais montrer que est convenablement délimité semble presque sûrement être quelque peu non trivial. Il semble que la preuve de cela puisse essentiellement faire partie de ce qui est discuté aux pages 265-267 de Galambos, mais je ne suis pas sûr étant donné que je travaille toujours à comprendre le contenu de ce livre.ΞnΞn

Quoi qu'il en soit, en supposant que l'on puisse montrer quelogΞn=o(logn) , il s'ensuit (puisque le terme domine le terme ) que:Zn2/2logZn

lognZn22Zn2logn.

C'est assez agréable, car c'est déjà la majeure partie de ce que nous voulons montrer, bien qu'il soit intéressant de noter que cela ne fait essentiellement que donner un coup de pied dans la rue, car maintenant nous devons montrer une certaine limite presque sûrement de . D'un autre côté, a la même distribution pour tout maximum de variables aléatoires continues iid, donc cela peut être traitable.ΞnΞn

Quoi qu'il en soit, si as, alors on peut clairement conclure que pour tout qui est comme . En utilisant notre lemme sur les fonctions du polylogue préservant l'équivalence asymptotique ci-dessus, nous pouvons remplacer cette expression dans pour obtenir:Zn2lognZn2logn(1+α(n))α(n)o(1)n(1)

log(2πΞn)lognlog(1+α)12log212loglognlogn2αlognα2logn.

log(Ξn2π)log(1+α)+12log2+12loglogn+2αlogn+α2logn.

Ici, nous devons aller encore plus loin et supposer que presque sûrementlogΞn=o(loglogn)  as  n . Encore une fois, tout ce que Cramer dit est "en supposant que est borné". Mais comme tout ce que l'on peut dire a priori sur est que as, il ne semble guère clair que l'on devrait avoir presque sûrement, ce qui semble être la substance de la revendication de Cramer.ΞnΞn0XinnΞn=O(1)

Mais de toute façon, en supposant que l'on y croit, alors il s'ensuit que le terme dominant qui ne contient pas est . Puisque , il s'ensuit que , et clairement , donc le terme dominant contenant est . Par conséquent, nous pouvons réorganiser et (en divisant tout par ou ) constater queα12loglognα=o(1)α2=o(α)log(1+α)=o(α)=o(o(αlogn))α2αlogn12loglogn2αlogn

12loglogn2αlognαloglogn4logn.

Par conséquent, en remplaçant cela dans ce qui précède, nous obtenons que:

Zn2lognloglogn22logn,

encore une fois, en supposant que nous croyons certaines choses sur .Ξn

Nous refaisons la même technique; puisque , il s'ensuit également queZn2lognloglogn22logn

Zn2lognloglogn22logn(1+β(n))=2logn(1loglogn8logn(1+β(n))),

quand . Simplifions un peu avant de replacer directement dans (1); nous obtenons cela:β(n)=o(1)

logZnlog(2logn)+log(1loglogn8logn(1+β(n)))log(O(1))=o(logn)log(2logn).

Zn22logn12loglogn(1+β)+(loglogn)28logn(1β)2o((1+β)loglogn)logn12(1+β)loglogn.

En substituant cela en (1), nous constatons que:

log(2πΞn)lognlog(2logn)logn+12(1+β)loglognβlog(4πΞn2)loglogn.

Par conséquent, nous concluons que presque sûrement

Zn2lognloglogn22logn(1+log(4π)+2log(Ξn)loglogn)=2lognloglogn+log(4π)22lognlog(Ξn)2logn.

Cela correspond au résultat final à la p. 374 des méthodes mathématiques de statistique de Cramer de 1946, sauf qu'ici, l'ordre exact du terme d'erreur n'est pas donné. Apparemment, appliquer ce terme de plus donne l'ordre exact du terme d'erreur, mais de toute façon il ne semble pas nécessaire de prouver les résultats sur les maxima des normales standard iid qui nous intéressent.


Compte tenu du résultat de ce qui précède, à savoir que presque sûrement:

()Zn2lognloglogn+log(4π)22lognlog(Ξn)2lognZn=2lognloglogn+log(4π)22lognlog(Ξn)2logn+o(1).

2. Ensuite, par linéarité de l'espérance, il s'ensuit que:

EZn=2lognloglogn+log(4π)22lognE[log(Ξn)]2logn+o(1)EZn2logn=1E[logΞn]2logn+o(1).

Par conséquent, nous avons montré que

limnEZn2logn=1,

aussi longtemps que nous pouvons également montrer que

E[logΞn]=o(logn).

Cela pourrait ne pas être trop difficile à montrer car, encore une fois, a la même distribution pour chaque variable aléatoire continue. Nous avons donc le deuxième résultat d'en haut.Ξn

1. De même, nous avons également de ce qui précède que presque sûrement:

Zn2logn=1log(Ξn)2logn+o(1),.

Par conséquent, si nous pouvons montrer que:

(*)log(Ξn)=o(logn) almost surely,

alors nous aurons montré le premier résultat d'en haut. Le résultat (*) impliquerait clairement a fortiori que , nous donnant ainsi également le premier résultat d'en haut.E[log(Ξn)]=o(logn)

Notez également que dans la preuve ci-dessus de ( ), nous devions supposer de toute façon que presque sûrement (ou au moins quelque chose de similaire), de sorte que si nous sommes en mesure de montrer ( ) alors nous aurons très probablement également dans le processus nécessaire pour montrer presque sûrement, et donc si nous pouvons prouver nous serons très probablement en mesure de parvenir immédiatement à toutes les conclusions suivantes.Ξn=o(logn)Ξn=o(logn)()

3. Cependant, si nous avons ce résultat, je ne comprends pas comment on aurait aussi ce , puisque . Mais au moins, il semblerait vrai queEZn=2logn+Θ(1)o(1)Θ(1)

EZn=2logn+O(1).


Il semble donc que nous pouvons nous concentrer sur la réponse à la question de savoir comment montrer que

Ξn=o(logn) almost surely.

Nous devrons également faire le travail de grognement pour fournir une preuve de (~), mais au meilleur de ma connaissance, ce n'est que du calcul et n'implique aucune théorie des probabilités, bien que je n'aie pas encore essayé de l'essayer.

Passons d'abord par une chaîne de trivialités afin de reformuler le problème d'une manière qui le rend plus facile à résoudre (notez que par définition ):Ξn0

Ξn=o(logn)limnΞnlogn=0ε>0,Ξnlogn>ε only finitely many timesε>0,Ξn>εlogn only finitely many times.

On a aussi ça:

Ξn>εlognn(1F(Zn))>εlogn1F(Zn)>εlognnF(Zn)<1εlognnZninf{y:F(y)1εlognn}.

En conséquence, définissez pour tout :n

un(ε)=inf{y:F(y)1εlognn}.

Par conséquent, les étapes ci-dessus nous montrent que:

Ξn=o(logn) a.s.P(Ξn=o(logn))=1P(ε>0,Ξn>εlogn only finitely many times)=1P(ε>0,Znun(ε) only finitely many times)=1P(ε>0,Znun(ε) infinitely often)=0.

Notez que nous pouvons écrire:

{ε>0,Znun(ε) infinitely often}=ε>0{Znun(ε) infinitely often}.

Les séquences deviennent uniformément plus grandes à mesure que diminue, nous pouvons donc conclure que les événements diminuent (ou au moins en quelque sorte monotone) car passe à . Par conséquent, l'axiome de probabilité concernant les séquences d'événements monotones nous permet de conclure que:un(ε)ε

{Znun(ε) infinitely often}
ε0

P(ε>0,Znun(ε) infinitely often)=P(ε>0{Znun(ε) infinitely often})=P(limε0{Znun(ε) infinitely often})=limε0P(Znun(ε) infinitely often).

Il suffit donc de montrer que pour tout ,ε>0

P(Znun(ε) infinitely often)=0

car bien sûr, la limite de toute séquence constante est la constante.

Voici un peu un résultat de marteau:

Théorème 4.3.1., P. 252 de Galambos, The Asymptotic Theory of Extreme Order Statistics , 2e édition. Soit variables iid avec une fonction de distribution non dégénérée et continue commune , et soit une séquence non décroissante telle que soit également non décroissante. Ensuite, pour , selon X1,X2,F(x)unn(1F(un))un<sup{x:F(x)<1}

P(Znun infinitely often)=0 or 1
j=1+[1F(uj)]exp(j[1F(uj)])<+ or =+.

La preuve est technique et prend environ cinq pages, mais finalement elle se révèle être le corollaire de l'un des lemmes Borel-Cantelli. Je vais peut-être essayer de condenser la preuve pour n'utiliser que la partie requise pour cette analyse ainsi que les hypothèses qui tiennent dans le cas gaussien, qui peuvent être plus courtes (mais peut-être pas) et les taper ici, mais retenir son souffle n'est pas recommandé. Notez que dans ce cas , de sorte que la condition est vide, et est donc clairement non décroissant.ω(F)=+n(1F(n))εlogn

Quoi qu'il en soit, le fait est que, faisant appel à ce théorème, si nous pouvons montrer que:

j=1+[1F(uj(ε))]exp(j[1F(uj(ε))])=j=1+[εlogjj]exp(εlogj)=εj=1+logjj1+ε<+.

Notez que la croissance logarithmique étant plus lente que toute croissance de loi de puissance pour tout exposant de loi de puissance positive (les logarithmes et les exponentielles préservent la monotonie, donc et l'ancienne inégalité peut toujours être considérée comme valable pour tout assez grand en raison du fait que et un changement de variables), nous avons ceci:loglognαlognlognnαnlognn

j=1+logjj1+εj=1+jε/2j1+ε=j=1+1j1+ε/2<+,

car la série p est connue pour converger pour tous les , et implique bien sûr .p>1ε>01+ε/2>1

Ainsi, en utilisant le théorème ci-dessus, nous avons montré que pour tout , , ce qui, pour récapituler, signifie que presque sûrement.ε>0P(Znun(ε) i.o.)=0Ξn=o(logn)

Nous devons encore montrer que . Cela ne découle pas de ce qui précède, car, par exemple,logΞn=o(loglogn)

1nlogn=o(logn),logn+loglogno(logn).

Cependant, étant donné une séquence , si l'on peut montrer que pour arbitraire , il s'ensuit que . Idéalement, j'aimerais pouvoir montrer ceci pour utilisant le lemme ci-dessus (en supposant que c'est même vrai), mais je ne suis pas en mesure de le faire (pour l'instant).xnxn=o((logn)δ)δ>0log(xn)=o(loglogn)Ξn

En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.