Y a-t-il un résultat qui indique que le bootstrap est valide si et seulement si la statistique est lisse?


25

Partout, nous supposons que notre statistique est une fonction de certaines données qui est tirée de la fonction de distribution ; la fonction de distribution empirique de notre échantillon est . Donc est la statistique considérée comme une variable aléatoire et est la version bootstrap de la statistique. Nous utilisons comme distance KSX 1 , ... X n F F de ( F ) de θ ( F ) d θ()X1,XnFF^θ(F)θ(F^)d

Il existe des résultats «si et seulement si» pour la validité du bootstrap si la statistique est une statistique linéaire simple. Par exemple, le théorème 1 de Mammen "Quand fonctionne le bootstrap?"

Si pour une fonction arbitraire alors le bootstrap fonctionne en ce sens que si et uniquement s'il existe et tels que Où nous pouvons définir comme une fonction de notre échantillon ethnd[L(θ( F ) - t n),L(θ(F)-tn)]p0σntnd[L(θ(F)-tn)θ(F)=1ni1nhn(Xi)hn

d[L(θ(F^)t^n),L(θ(F)tn)]p0
σntn^ t n t n = E ( t n )
d[L(θ(F)tn),N(0,σn2)]p0
tn^tn=E(t^n)

Il existe également des résultats plus généraux que le bootstrap fonctionne pour les statistiques générales, par exemple le théorème 1.6.3 de Subsampling de Politis Romano et Wolf:

Supposons que est tiré de la classe de toutes les distributions avec un support fini. Supposons que la statistique est Frechet différentiable à par rapport à la norme supremum et que la dérivée satisfait . Alors est asymptotiquement normal et le bootstrap fonctionne dans le sens du théorème précédent.θ ( ) F g F 0 < Var F [ g F ( x ) ] < θ ( F )Fθ()FgF0<VarF[gF(x)]<θ(F)

Je voudrais une version «si et seulement si» du deuxième théorème. Cela nécessitera une notion de lissage différente de la différentiabilité de Frechet car Politis, Romano et Wolf (1999) montrent que la médiane de l'échantillon n'est pas Frechet différenciable mais que le bootstrap fonctionne toujours. Cependant, la médiane de l'échantillon est toujours une fonction fluide des données.

Il y a quelques commentaires informels dans Mammen que la douceur est nécessaire:

La linéarité asymptotique typiquement locale semble nécessaire pour la cohérence du bootstrap

La citation est de:

van Zwet, W (1989). Conférence donnée à la conférence sur les "méthodes asymptotiques pour les procédures informatiques intensives en statistiques" à Olberwolfach.

Mais je ne trouve aucune trace de ce discours à part une poignée de citations.


1
Excellent sujet. Est-il exact que tous les résultats cités sont asymptotiques pour des tailles d'échantillon allant à l'infini?
Michael M

3
n

1
Sujet compliqué. Certains disent que le bootstrap ne fonctionne pas en général. van Zwer et al. ne dit qu'il faut faire attention à ce qui est bootstraped . Je pense qu'il faut d'abord déterminer ce qu'il faut bootstrap et ce qu'il ne faut pas bootstrap avant que d'autres tests ne soient justifiés.
Carl

Maintenant, j'ai mis à jour la réponse en réponse au commentaire de Mammen, j'espère que cela clarifiera davantage votre confusion. Et si vous le souhaitez, vous pouvez expliquer un peu l'application qui vous motive à vous interroger sur la nécessité. Cela m'aidera à améliorer ma réponse.
Henry.L

Réponses:


12

Vous avez besoin de la différentiabilité Hadamard (ou de la différentiabilité compacte selon votre source de référence) comme condition suffisante pour que le bootstrap fonctionne dans ce cas, la médiane et tout quantile est Hadamard différenciable. La différenciabilité de Frechet est trop forte dans la plupart des applications.

Comme il suffit généralement de discuter d'un espace polonais, vous souhaitez qu'une fonction localement linéaire applique un argument de compacité typique pour étendre votre résultat de cohérence à la situation globale. Voir également le commentaire de linéarisation ci-dessous.

ρTnn

[Shao & Tu] pp.85-86 ont illustré des situations où une incohérence des estimateurs bootstrap peut se produire.

FHBOOTH0

Tn

(3) Le comportement de l'estimateur bootstrap dépend parfois de la méthode utilisée pour obtenir les données bootstrap.

K

Quant au commentaire "La linéarité asymptotique typiquement locale semble nécessaire pour la cohérence du bootstrap" fait par Mammen comme vous l'avez mentionné. Un commentaire de [Shao & Tu] p.78 est le suivant, car ils ont commenté que la linéarisation (globale) n'est qu'une technique qui facilite la preuve de cohérence et n'indique aucune nécessité:

Zn¯=1ni=1nϕ(Xn)ϕ(X)X

Tn=θ+Zn¯+oP(1n)
TnZn¯TnZn¯{X1,,Xn}Tn
Tn=θ+Zn¯+oP(1n)
HBOOT(x)x=P{n(TnTn)x}P{n(Zn¯Zn¯)x}Zn¯

Et ils ont donné un exemple 3.3 d'obtention de la cohérence du bootstrap pour le bootstrap de type MLE. Cependant, si la linéarité globale est efficace de cette manière, il est difficile d'imaginer comment on pourrait prouver la cohérence sans linéarité locale. Donc je suppose que c'est ce que Mammen voulait dire.

Au-delà de la discussion fournie par [Shao & Tu] ci-dessus, je pense que vous voulez une condition de caractérisation de la cohérence des estimateurs bootstrap.

M(X)TCLT

M(X)

Je déteste être cynique, mais je pense toujours que ce n'est pas la seule écriture statistique qui "cite du vide". En disant cela, je pense simplement que la citation du discours de van Zwet est très irresponsable bien que van Zwet soit un grand érudit.

[Wasserman] Wasserman, Larry. Toutes les statistiques non paramétriques, Springer, 2010.

[Shao & Tu] Shao, Jun et Dongsheng Tu. Le jackknife et le bootstrap. Springer, 1995.

[Gine & Zinn] Giné, Evarist et Joel Zinn. «Bootstrapping general empirical measures». The Annals of Probability (1990): 851-869.

[Huber] Huber, Peter J. Statistiques robustes. Wiley, 1985.

En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.