La question demande deux choses: (1) comment montrer que le maximum converge, dans le sens où converge (en distribution) pour des séquences convenablement choisies et , à la distribution de Gumbel standard et (2) comment trouver de telles séquences. ( X ( n ) - b n ) / a n ( a n ) ( b n )X( n )( X( n )- bn) / an( unn)( bn)
Le premier est bien connu et documenté dans les articles originaux sur le théorème de Fisher-Tippett-Gnedenko (FTG). Le second semble plus difficile; c'est la question abordée ici.
Veuillez noter, pour clarifier certaines affirmations apparaissant ailleurs dans ce fil, que
Le maximum ne pas convergeant à quoi que ce soit: il diverge (quoique très lentement).
Il semble y avoir différentes conventions concernant la distribution de Gumbel. J'adopterai la convention selon laquelle le CDF d'une distribution de Gumbel inversée est, jusqu'à l'échelle et l'emplacement, donné par . Un maximum convenablement normalisé de variables iid normales converge vers une distribution de Gumbel inversée.1 - exp( - exp( x ) )
Intuition
Lorsque les sont iid avec la fonction de distribution commune , la distribution du maximum est F X ( n )XjeFX( n )
Fn( x ) = Pr ( X( n )≤ x ) = Pr ( X1≤ x ) Pr ( X2≤ x ) ⋯ Pr ( Xn≤ x ) = Fn( x ) .
Lorsque le support de n'a pas de limite supérieure, comme avec une distribution normale, la séquence de fonctions marche pour toujours vers la droite sans limite:F nFFn
Des graphiques partiels de pour sont affichés. n = 1 , 2 , 2 2 , 2 4 , 2 8 , 2 16Fnn = 1 , 2 , 22, 24, 28, 216
Pour étudier les formes de ces distributions, nous pouvons déplacer chacune vers la gauche d'une certaine quantité et la redimensionner de pour les rendre comparables.a nbnunen
Chacun des graphiques précédents a été déplacé pour placer sa médiane à et pour faire sa plage interquartile de longueur unitaire.0
FTG affirme que les séquences et peuvent être choisies de sorte que ces fonctions de distribution convergent de façon ponctuelle à chaque vers une distribution de valeur extrême , jusqu'à l'échelle et l'emplacement. Lorsque est une distribution normale, la distribution de valeur extrême limite particulière est un Gumbel inversé, jusqu'à l'emplacement et l'échelle.( b n ) x F( unn)( bn)XF
Solution
Il est tentant d'émuler le théorème de la limite centrale en normalisant pour avoir une moyenne unitaire et une variance unitaire. Cela est inapproprié, cependant, en partie parce que FTG s'applique même aux distributions (continues) qui n'ont pas de premier ou de second moment. Utilisez plutôt un centile (comme la médiane) pour déterminer l'emplacement et une différence de centiles (comme l'IQR) pour déterminer la propagation. (Cette approche générale devrait réussir à trouver et pour toute distribution continue.)a n b nFnunenbn
Pour la distribution normale standard, cela s'avère facile! Soit . Un quantile de correspondant à est toute valeur pour laquelle . Rappelant la définition de , la solution estF n q x q F n ( x q ) = q F n ( x ) = F n ( x )0 < q< 1FnqXqFn( xq) = qFn( x ) = Fn( x )
Xq; n= F- 1( q1 / n) .
Par conséquent, nous pouvons définir
bn= xUne / 2 ; n, un n= xTrois / 4 ; n- xUne / 4 ; n; g n( x ) = Fn( unnx + bn) .
Parce que, par construction, la médiane de est et son IQR est , la médiane de la valeur limite de (qui est une version d'une Gumbel inversée) doit être et son IQR doit être . Soit le paramètre d'échelle et le paramètre d'emplacement . Étant donné que la médiane est et que l'IQR se trouve facilement être , les paramètres doivent êtregn01gn01βαα + βJournalJournal( 2 )β( journalJournal( 4 ) - journalJournal( Quatre / trois ) )
α = logJournal2JournalJournal( Quatre / trois ) - logJournal( 4 ); β = 1JournalJournal( 4 ) - journalJournal( Quatre / trois ).
Il n'est pas nécessaire que et soient exactement ces valeurs: elles n'ont besoin que de les approcher, à condition que la limite de soit toujours cette distribution de Gumbel inversée. Une analyse simple (mais fastidieuse) pour un normal standard indique que les approximationsunenbngnF
une′n= journal( ( 4 journaux2( 2 ) ) / ( journal2( 43) ) )2 2 journal( n )------√, b ′n= 2 log( n )------√- journal( journal( n ) ) + journal( 4 πJournal2( 2 ) )2 2 journal( n )------√
fonctionnera bien (et est aussi simple que possible).
Les courbes bleu clair sont des graphiques partiels de pour utilisant les séquences approximatives et . La ligne rouge foncé représente la distribution de Gumbel inversée avec les paramètres et . La convergence est claire (bien que le taux de convergence pour négatif soit sensiblement plus lent).gnn = 2 , 26, 211, 216une′nb′nαβX
Les références
BV Gnedenko, Sur la distribution limitative de la durée maximale d'une série aléatoire . Dans Kotz et Johnson, Breakthroughs in Statistics Volume I: Foundations and Basic Theory, Springer, 1992. Traduit par Norman Johnson.