Partout, nous supposons que notre statistique est une fonction de certaines données qui est tirée de la fonction de distribution ; la fonction de distribution empirique de notre échantillon est . Donc est la statistique considérée comme une variable aléatoire et est la version bootstrap de la statistique. Nous utilisons comme distance KSX 1 , ... X n F F de ( F ) de θ ( F ) d ∞
Il existe des résultats «si et seulement si» pour la validité du bootstrap si la statistique est une statistique linéaire simple. Par exemple, le théorème 1 de Mammen "Quand fonctionne le bootstrap?"
Si pour une fonction arbitraire alors le bootstrap fonctionne en ce sens que si et uniquement s'il existe et tels que Où nous pouvons définir comme une fonction de notre échantillon ethnd∞[L(θ( F ) - t n),L(θ(F)-tn)]→p0σntnd∞[L(θ(F)-tn)
^ t n t n = E ( t n )
Il existe également des résultats plus généraux que le bootstrap fonctionne pour les statistiques générales, par exemple le théorème 1.6.3 de Subsampling de Politis Romano et Wolf:
Supposons que est tiré de la classe de toutes les distributions avec un support fini. Supposons que la statistique est Frechet différentiable à par rapport à la norme supremum et que la dérivée satisfait . Alors est asymptotiquement normal et le bootstrap fonctionne dans le sens du théorème précédent.θ ( ⋅ ) F g F 0 < Var F [ g F ( x ) ] < ∞ θ ( F )
Je voudrais une version «si et seulement si» du deuxième théorème. Cela nécessitera une notion de lissage différente de la différentiabilité de Frechet car Politis, Romano et Wolf (1999) montrent que la médiane de l'échantillon n'est pas Frechet différenciable mais que le bootstrap fonctionne toujours. Cependant, la médiane de l'échantillon est toujours une fonction fluide des données.
Il y a quelques commentaires informels dans Mammen que la douceur est nécessaire:
La linéarité asymptotique typiquement locale semble nécessaire pour la cohérence du bootstrap
La citation est de:
van Zwet, W (1989). Conférence donnée à la conférence sur les "méthodes asymptotiques pour les procédures informatiques intensives en statistiques" à Olberwolfach.
Mais je ne trouve aucune trace de ce discours à part une poignée de citations.