Pourquoi le supremum du pont brownien a-t-il la distribution de Kolmogorov – Smirnov?


16

La distribution de Kolmogorov – Smirnov est connue d'après le test de Kolmogorov – Smirnov . Mais c'est aussi la distribution du supremum du pont brownien.

Comme c'est loin d'être évident (pour moi), je voudrais vous demander une explication intuitive de cette coïncidence. Les références sont également les bienvenues.


@GaBorgulya: Qu'avez-vous changé?
Rasmus

Voir ici et ici .
cardinal

Réponses:


13

nsupx|FnF|=supx|1ni=1nZi(x)|

Zi(x)=1XixE[1Xix]

par CLT vous avez Gn=1ni=1nZi(x)N(0,F(x)(1F(X)))

c'est l'intuition ...

le pont brownien a la variance http://en.wikipedia.org/wiki/Brownian_bridge remplacer par . C'est pour un ...t ( 1 - t ) t F ( x ) xB(t)t(1-t) tF(X)X

Vous devez également vérifier la covariance et il est donc toujours facile de montrer (CLT) que pour ( ) où est avec , . ( G n ( x 1 ) , , G n ( x k ) ) ( B 1 , , B k ) ( B 1 , , B k ) N ( 0 , Σ ) Σ = ( σ i j ) σ i j = minX1,,Xk(gn(X1),,gn(Xk))(B1,,Bk)(B1,,Bk)N(0,Σ)Σ=(σjej)σjej=min(F(Xje),F(Xj))-F(Xje)F(Xj)

La partie difficile est de montrer que la distribution du suppremum de la limite est le supremum de la distribution de la limite ... Comprendre pourquoi cela se produit nécessite une théorie des processus empiriques, en lisant des livres tels que van der Waart et Welner (pas facile) . Le nom du théorème est le théorème de Donsker http://en.wikipedia.org/wiki/Donsker%27s_theorem ...


Ne devrions-nous pas appliquer le CLT à toutes les distributions marginales de dimension finie?
Rasmus

vous avez demandé une réponse intuitive :) aussi je choisis de ne pas vous déranger avec la partie mathématique délicate qui est de montrer que la convergence pour tous t implique la convergence (en droit) du supremum ... voulez-vous que je complète le répondre ?
robin girard

Cher Robin Girard, je pense que votre réponse est bonne en l'état. Je vous remercie!
Rasmus

1
la partie difficile est en fait de montrer une faible convergence. La convergence des supremums découle alors directement du théorème de cartographie continue. Ce résultat peut être trouvé dans la "convergence des mesures de probabilité" de Billingsley. Van der Vaart et Wellner donnent un résultat plus général et leur livre est vraiment, vraiment difficile :)
mpiktas

@robingirard Personnellement, j'aimerais voir une "réponse complète" avec toutes les "parties mathématiques délicates"
StatsPlease

6

Pour Kolmogorov-Smirnov, considérons l'hypothèse nulle. Il dit qu'un échantillon est tiré d'une distribution particulière. Donc si vous construisez la fonction de distribution empirique pour échantillons , dans la limite des données infinies, il converger vers la distribution sous-jacente.f ( x ) = 1nF(X)=1njeχ(-,Xje](X)

Pour des informations finies, il sera désactivé. Si l'une des mesures est , alors à la fonction de distribution empirique monte d'un cran. Nous pouvons le considérer comme une marche aléatoire qui est contrainte de commencer et de se terminer sur la vraie fonction de distribution. Une fois que vous savez cela, vous allez fouiller la littérature pour la grande quantité d'informations connues sur les promenades aléatoires pour découvrir quelle est la plus grande déviation attendue d'une telle marche.qX=q

Vous pouvez faire la même astuce avec n'importe quelle normale de la différence entre les fonctions de distribution empiriques et sous-jacentes. Pour , cela s'appelle le test de Cramer-von Mises. Je ne connais pas l'ensemble de ces tests pour les arbitraires réels et positifs d' une classe complète de quelque nature que ce soit, mais cela pourrait être une chose intéressante à regarder.pp=2p

En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.