WIP: Travaux en cours
Après p. 370 des méthodes mathématiques de statistique de Cramer de 1946 , définissentIci est la fonction de distribution cumulative de la distribution normale standard, . En conséquence de sa définition, nous sommes assurés que presque sûrement.Ξn=n(1−Φ(Zn)).
ΦN(0,1)0≤Ξn≤n
Considérons une réalisation donnée de notre espace échantillon. Dans ce sens, est donc à la fois une fonction de et , et une fonction de et . Pour un fixe , nous pouvons considérer une fonction déterministe de , et une fonction déterministe de et , simplifiant ainsi le problème. Notre objectif est de montrer des résultats qui valent pour presque tous lesω∈ΩZnnωΞnZn,nωωZnnΞnZnnω∈Ω, ce qui nous permet de transférer nos résultats d'une analyse non déterministe au cadre non déterministe.
Après p. 374 de Cramer 1946 Mathematical Methods of Statistics, supposons pour le moment (je vise à revenir et à fournir une preuve plus tard) que nous sommes en mesure de montrer que (pour tout ) l'expansion asymptotique suivante tient (en utilisant intégration par parties et définition de ):ω∈ΩΦ
2π−−√nΞn=1Zne−Z2n2(1+O(1Z2n)) as Zn→∞.(~)
Clairement, nous avons que pour tout , et est presque sûrement une fonction croissante de comme , donc nous affirmons dans ce qui suit tout au long de cela (presque sûrement tous) fixe :Zn+1≥ZnnZnnn→∞ωZn→∞⟺n→∞.
Il s'ensuit donc que nous avons (où dénote l'équivalence asymptotique ):∼
2π−−√nΞn∼1Zne−1Z2n as Zn→∞n→∞.
La façon dont nous procédons dans ce qui suit revient essentiellement à la méthode de l'équilibre dominant , et nos manipulations seront formellement justifiées par le lemme suivant:
Lemme: Supposons que comme , et (donc ). Etant donné toute fonction qui est formée via des compositions, des additions et des multiplications de logarithmes et de lois de puissance (essentiellement n'importe quelle fonction " polylog "), nous devons également avoir cela comme :En d'autres termes, de telles fonctions "polylog" préservent l'équivalence asymptotique .f(n)∼g(n)n→∞f(n)→∞g(n)→∞hn → ∞ h ( f ( n ) ) ∼ h ( g ( n ) )n→∞h(f(n))∼h(g(n)).
La vérité de ce lemme est une conséquence du théorème 2.1. comme écrit ici . Notez également que ce qui suit est principalement une version étendue (plus de détails) de la réponse à une question similaire trouvée ici .
En prenant des logarithmes des deux côtés, nous obtenons que:
log(2π−−√Ξn)−logn∼−logZn−Z2n2.(1)
C'est là que Cramer est quelque peu méfiant; il dit simplement "en supposant que est borné", nous pouvons conclure bla bla bla. Mais montrer que est convenablement délimité semble presque sûrement être quelque peu non trivial. Il semble que la preuve de cela puisse essentiellement faire partie de ce qui est discuté aux pages 265-267 de Galambos, mais je ne suis pas sûr étant donné que je travaille toujours à comprendre le contenu de ce livre.ΞnΞn
Quoi qu'il en soit, en supposant que l'on puisse montrer quelogΞn=o(logn) , il s'ensuit (puisque le terme domine le terme ) que:−Z2n/2−logZn
−logn∼−Z2n2⟹Zn∼2logn−−−−−√.
C'est assez agréable, car c'est déjà la majeure partie de ce que nous voulons montrer, bien qu'il soit intéressant de noter que cela ne fait essentiellement que donner un coup de pied dans la rue, car maintenant nous devons montrer une certaine limite presque sûrement de . D'un autre côté, a la même distribution pour tout maximum de variables aléatoires continues iid, donc cela peut être traitable.ΞnΞn
Quoi qu'il en soit, si as, alors on peut clairement conclure que pour tout qui est comme . En utilisant notre lemme sur les fonctions du polylogue préservant l'équivalence asymptotique ci-dessus, nous pouvons remplacer cette expression dans pour obtenir:Zn∼2logn−−−−−√Zn∼2logn−−−−−√(1+α(n))α(n)o(1)n→∞(1)
log(2π−−√Ξn)−logn∼−log(1+α)−12log2−12loglogn−logn−2αlogn−α2logn.
⟹−log(Ξn2π−−√)∼log(1+α)+12log2+12loglogn+2αlogn+α2logn.
Ici, nous devons aller encore plus loin et supposer que presque sûrementlogΞn=o(loglogn) as n→∞ . Encore une fois, tout ce que Cramer dit est "en supposant que est borné". Mais comme tout ce que l'on peut dire a priori sur est que as, il ne semble guère clair que l'on devrait avoir presque sûrement, ce qui semble être la substance de la revendication de Cramer.ΞnΞn0≤Xin≤nΞn=O(1)
Mais de toute façon, en supposant que l'on y croit, alors il s'ensuit que le terme dominant qui ne contient pas est . Puisque , il s'ensuit que , et clairement , donc le terme dominant contenant est . Par conséquent, nous pouvons réorganiser et (en divisant tout par ou ) constater queα12loglognα=o(1)α2=o(α)log(1+α)=o(α)=o(o(αlogn))α2αlogn12loglogn2αlogn
−12loglogn∼2αlogn⟹α∼−loglogn4logn.
Par conséquent, en remplaçant cela dans ce qui précède, nous obtenons que:
Zn∼2logn−−−−−√−loglogn22logn−−−−−√,
encore une fois, en supposant que nous croyons certaines choses sur .Ξn
Nous refaisons la même technique; puisque , il s'ensuit également queZn∼2logn−−−−−√−loglogn22logn√
Zn∼2logn−−−−−√−loglogn22logn−−−−−√(1+β(n))=2logn−−−−−√(1−loglogn8logn(1+β(n))),
quand . Simplifions un peu avant de replacer directement dans (1); nous obtenons cela:β(n)=o(1)
logZn∼log(2logn−−−−−√)+log(1−loglogn8logn(1+β(n)))log(O(1))=o(logn)∼log(2logn−−−−−√).
Z2n2∼logn−12loglogn(1+β)+(loglogn)28logn(1β)2o((1+β)loglogn)∼logn−12(1+β)loglogn.
En substituant cela en (1), nous constatons que:
log(2π−−√Ξn)−logn∼−log(2logn−−−−−√)−logn+12(1+β)loglogn⟹β∼log(4πΞ2n)loglogn.
Par conséquent, nous concluons que presque sûrement
Zn∼2logn−−−−−√−loglogn22logn−−−−−√(1+log(4π)+2log(Ξn)loglogn)=2logn−−−−−√−loglogn+log(4π)22logn−−−−−√−log(Ξn)2logn−−−−−√.
Cela correspond au résultat final à la p. 374 des méthodes mathématiques de statistique de Cramer de 1946, sauf qu'ici, l'ordre exact du terme d'erreur n'est pas donné. Apparemment, appliquer ce terme de plus donne l'ordre exact du terme d'erreur, mais de toute façon il ne semble pas nécessaire de prouver les résultats sur les maxima des normales standard iid qui nous intéressent.
Compte tenu du résultat de ce qui précède, à savoir que presque sûrement:
Zn∼2logn−−−−−√−loglogn+log(4π)22logn−−−−−√−log(Ξn)2logn−−−−−√⟹Zn=2logn−−−−−√−loglogn+log(4π)22logn−−−−−√−log(Ξn)2logn−−−−−√+o(1).(†)
2. Ensuite, par linéarité de l'espérance, il s'ensuit que:
EZn=2logn−−−−−√−loglogn+log(4π)22logn−−−−−√−E[log(Ξn)]2logn−−−−−√+o(1)⟹EZn2logn−−−−−√=1−E[logΞn]2logn+o(1).
Par conséquent, nous avons montré que
limn→∞EZn2logn−−−−−√=1,
aussi longtemps que nous pouvons également montrer que
E[logΞn]=o(logn).
Cela pourrait ne pas être trop difficile à montrer car, encore une fois, a la même distribution pour chaque variable aléatoire continue. Nous avons donc le deuxième résultat d'en haut.Ξn
1. De même, nous avons également de ce qui précède que presque sûrement:
Zn2logn−−−−−√=1−log(Ξn)2logn+o(1),.
Par conséquent, si nous pouvons montrer que:
log(Ξn)=o(logn) almost surely,(*)
alors nous aurons montré le premier résultat d'en haut. Le résultat (*) impliquerait clairement a fortiori que , nous donnant ainsi également le premier résultat d'en haut.E[log(Ξn)]=o(logn)
Notez également que dans la preuve ci-dessus de ( ), nous devions supposer de toute façon que presque sûrement (ou au moins quelque chose de similaire), de sorte que si nous sommes en mesure de montrer ( ) alors nous aurons très probablement également dans le processus nécessaire pour montrer presque sûrement, et donc si nous pouvons prouver nous serons très probablement en mesure de parvenir immédiatement à toutes les conclusions suivantes.†Ξn=o(logn)†Ξn=o(logn)(†)
3. Cependant, si nous avons ce résultat, je ne comprends pas comment on aurait aussi ce , puisque . Mais au moins, il semblerait vrai queEZn=2logn−−−−−√+Θ(1)o(1)≠Θ(1)EZn=2logn−−−−−√+O(1).
Il semble donc que nous pouvons nous concentrer sur la réponse à la question de savoir comment montrer queΞn=o(logn) almost surely.
Nous devrons également faire le travail de grognement pour fournir une preuve de (~), mais au meilleur de ma connaissance, ce n'est que du calcul et n'implique aucune théorie des probabilités, bien que je n'aie pas encore essayé de l'essayer.
Passons d'abord par une chaîne de trivialités afin de reformuler le problème d'une manière qui le rend plus facile à résoudre (notez que par définition ):Ξn≥0
Ξn=o(logn)⟺limn→∞Ξnlogn=0⟺∀ε>0,Ξnlogn>ε only finitely many times⟺∀ε>0,Ξn>εlogn only finitely many times.
On a aussi ça:
Ξn>εlogn⟺n(1−F(Zn))>εlogn⟺1−F(Zn)>εlognn⟺F(Zn)<1−εlognn⟺Zn≤inf{y:F(y)≥1−εlognn}.
En conséquence, définissez pour tout :n
u(ε)n=inf{y:F(y)≥1−εlognn}.
Par conséquent, les étapes ci-dessus nous montrent que:
Ξn=o(logn) a.s.⟺P(Ξn=o(logn))=1⟺P(∀ε>0,Ξn>εlogn only finitely many times)=1⟺P(∀ε>0,Zn≤u(ε)n only finitely many times)=1⟺P(∀ε>0,Zn≤u(ε)n infinitely often)=0.
Notez que nous pouvons écrire:
{∀ε>0,Zn≤u(ε)n infinitely often}=⋂ε>0{Zn≤u(ε)n infinitely often}.
Les séquences deviennent uniformément plus grandes à mesure que diminue, nous pouvons donc conclure que les événements diminuent (ou au moins en quelque sorte monotone) car passe à . Par conséquent, l'axiome de probabilité concernant les séquences d'événements monotones nous permet de conclure que:u(ε)nε{Zn≤u(ε)n infinitely often}
ε0
P(∀ε>0,Zn≤u(ε)n infinitely often)=P(⋂ε>0{Zn≤u(ε)n infinitely often})=P(limε↓0{Zn≤u(ε)n infinitely often})=limε↓0P(Zn≤u(ε)n infinitely often).
Il suffit donc de montrer que pour tout ,ε>0
P(Zn≤u(ε)n infinitely often)=0
car bien sûr, la limite de toute séquence constante est la constante.
Voici un peu un résultat de marteau:
Théorème 4.3.1., P. 252 de Galambos, The Asymptotic Theory of Extreme Order Statistics , 2e édition. Soit variables iid avec une fonction de distribution non dégénérée et continue commune , et soit une séquence non décroissante telle que soit également non décroissante. Ensuite, pour ,
selon
X1,X2,…F(x)unn(1−F(un))un<sup{x:F(x)<1}P(Zn≤un infinitely often)=0 or 1
∑j=1+∞[1−F(uj)]exp(−j[1−F(uj)])<+∞ or =+∞.
La preuve est technique et prend environ cinq pages, mais finalement elle se révèle être le corollaire de l'un des lemmes Borel-Cantelli. Je vais peut-être essayer de condenser la preuve pour n'utiliser que la partie requise pour cette analyse ainsi que les hypothèses qui tiennent dans le cas gaussien, qui peuvent être plus courtes (mais peut-être pas) et les taper ici, mais retenir son souffle n'est pas recommandé. Notez que dans ce cas , de sorte que la condition est vide, et est donc clairement non décroissant.ω(F)=+∞n(1−F(n))εlogn
Quoi qu'il en soit, le fait est que, faisant appel à ce théorème, si nous pouvons montrer que:
∑j=1+∞[1−F(u(ε)j)]exp(−j[1−F(u(ε)j)])=∑j=1+∞[εlogjj]exp(−εlogj)=ε∑j=1+∞logjj1+ε<+∞.
Notez que la croissance logarithmique étant plus lente que toute croissance de loi de puissance pour tout exposant de loi de puissance positive (les logarithmes et les exponentielles préservent la monotonie, donc et l'ancienne inégalité peut toujours être considérée comme valable pour tout assez grand en raison du fait que et un changement de variables), nous avons ceci:loglogn≤αlogn⟺logn≤nαnlogn≤n
∑j=1+∞logjj1+ε≤∑j=1+∞jε/2j1+ε=∑j=1+∞1j1+ε/2<+∞,
car la série p est connue pour converger pour tous les , et implique bien sûr .p>1ε>01+ε/2>1
Ainsi, en utilisant le théorème ci-dessus, nous avons montré que pour tout , , ce qui, pour récapituler, signifie que presque sûrement.ε>0P(Zn≤u(ε)n i.o.)=0Ξn=o(logn)
Nous devons encore montrer que . Cela ne découle pas de ce qui précède, car, par exemple,logΞn=o(loglogn)
1nlogn=o(logn),−logn+loglogn≠o(logn).
Cependant, étant donné une séquence , si l'on peut montrer que pour arbitraire , il s'ensuit que . Idéalement, j'aimerais pouvoir montrer ceci pour utilisant le lemme ci-dessus (en supposant que c'est même vrai), mais je ne suis pas en mesure de le faire (pour l'instant).xnxn=o((logn)δ)δ>0log(xn)=o(loglogn)Ξn