Quels sont les exemples où un «bootstrap naïf» échoue?


86

Supposons que je dispose d’un ensemble d’échantillons de données d’une distribution inconnue ou complexe et que je veuille effectuer une inférence sur une statistique T des données. Mon inclinaison par défaut est de simplement générer un tas d'échantillons bootstrap avec le remplacement, et calculer ma statistique T sur chaque échantillon bootstrap pour créer une distribution estimée pour T .

Quels sont les exemples où c'est une mauvaise idée?

Par exemple, si j’essaie d’utiliser les données de la série chronologique d’amorçage (par exemple, pour vérifier si j’ai une autocorrélation significative), l’échec de la réalisation de ce bootstrap échouerait naïvement. Le bootstrap naïf décrit ci-dessus (générer le i ème point de donnée de la série d'échantillons du boot boot par échantillonnage avec remplacement de ma série d'origine) serait (je pense) déconseillé, car il ignore la structure dans ma série chronologique d'origine, et nous Obtenez des techniques d'amorçage plus sophistiquées comme le bootstrap en bloc.

En d'autres termes, qu'y a-t-il dans le bootstrap à part "l'échantillonnage avec remplacement"?


Si vous voulez faire une inférence pour la moyenne des données iid, le bootstrap est un excellent outil. Tout le reste est discutable et nécessite une preuve au cas par cas d'une convergence faible.
mardi

Réponses:


67

Si la quantité d'intérêt, généralement fonctionnelle d'une distribution, est raisonnablement fluide et que vos données sont idiates, vous êtes généralement dans un territoire assez sûr. Bien entendu, le bootstrap fonctionnera également dans d’autres circonstances.

Ce que cela signifie pour le bootstrap "d'échouer"

En gros, l'objectif du bootstrap est de construire une distribution d'échantillonnage approximative pour la statistique d'intérêt. Il ne s'agit pas d'une estimation réelle du paramètre. Donc, si la statistique d’intérêt (sous certains et de centrage) est et dans la distribution, nous aimerions que notre distribution bootstrap soit: converger vers la distribution de . Si nous ne l'avons pas, nous ne pouvons pas nous fier aux inférences.X^nX^nXX

L' exemple canonique du moment où le bootstrap peut échouer, même dans un cadre iid, consiste à essayer d'approximer la distribution d'échantillonnage d'une statistique d'ordre extrême. Vous trouverez ci-dessous une brève discussion.

Statistique d'ordre maximum d'un échantillon aléatoire d'une distributionU[0,θ]

Soit une suite de variables aléatoires uniformes sur i . Soit . La distribution de est (Notez que par un argument très simple, cela montre également que en probabilité, et même, presque sûrement , si les variables aléatoires sont toutes définies sur le même espace.)X1,X2,[0,θ]X(n)=max1knXkX(n)

P(X(n)x)=(x/θ)n.
X(n)θ

Un calcul élémentaire donne ou, en d'autres termes, converge dans la distribution en une variable aléatoire exponentielle de moyenne .

P(n(θX(n))x)=1(1xθn)n1ex/θ,
n(θX(n))θ

Maintenant, nous formons une estimation bootstrap (naïve) de la distribution de en rééchantillonnant avec remplacement pour obtenir et en utilisant la distribution de conditionnel à .n(θX(n))X1,,XnX1,,Xnn(X(n)X(n))X1,,Xn

Mais que avec une probabilité de , et que la distribution bootstrap a une masse de points nulle même asymptotiquement malgré le fait que la distribution limite réelle est continue.X(n)=X(n)1(11/n)n1e1

Plus explicitement, bien que la vraie distribution limite soit exponentielle avec mean , la distribution bootstrap limite place une masse de points à zéro de taille indépendamment de la valeur réelle de . En prenant suffisamment grand, nous pouvons rendre la probabilité de la vraie distribution limite arbitraire petite pour tout intervalle fixe , mais le bootstrap signalera ( toujours !) Qu'il existe au moins une probabilité de 0,632 dans cet intervalle! À partir de cela, il devrait être clair que le bootstrap peut se comporter de manière arbitrairement mauvaise dans ce contexte.θ1e10.632 θθ[0,ε)

En résumé, le démarrage échoue (misérablement) dans ce cas. Les choses ont tendance à se gâter lorsque l'on traite des paramètres situés au bord de l'espace des paramètres.

Un exemple tiré d'un échantillon de variables aléatoires normales

Il existe d'autres exemples similaires d'échec du bootstrap dans des circonstances étonnamment simples.

Prenons un exemple de où l’espace de paramètre pour est limité à . Le MLE dans ce cas est . Encore une fois, nous utilisons l’estimation de bootstrap . De nouveau, on peut montrer que la distribution de (conditionnée à l'échantillon observé) ne converge pas vers la même distribution limite que .X1,X2,N(μ,1)μ[0,)X^n=max(X¯,0)X^n=max(X¯,0)n(X^nX^n)n(X^nμ)

Matrices échangeables

L’un des exemples les plus dramatiques est peut-être celui d’une matrice échangeable. Soit un tableau de variables aléatoires tel que, pour chaque paire de matrices de permutation et , les tableaux et ont la même distribution conjointe. Autrement dit, la permutation des lignes et des colonnes de conserve l’invariant de la distribution. (Vous pouvez penser à un modèle à effets aléatoires à deux voies avec une observation par cellule, par exemple, bien que le modèle soit beaucoup plus général.)Y=(Yij)PQYPYQY

Supposons que nous voulions estimer un intervalle de confiance pour la moyenne ( en raison de l'hypothèse de l' interchangeabilité décrit ci - dessus les moyens de tous les les cellules doivent être les mêmes).μ=E(Yij)=E(Y11)

McCullagh (2000) a examiné deux manières différentes (naïves) d’amorcer un tel tableau. La variance asymptotique de la moyenne d'échantillon n'est pas correcte pour aucun d'entre eux. Il examine également quelques exemples de tableau et de régression linéaire échangeables dans un sens.

Références

Malheureusement, le sujet étant non trivial, aucun d’entre eux n’est particulièrement facile à lire.

P. Bickel et D. Freedman, Une théorie asymptotique pour le bootstrap . Ann. Stat. , vol. 9, non. 6 (1981), 1196-1217.

DWK Andrews, Incohérence du bootstrap lorsqu'un paramètre est à la limite de l'espace des paramètres , Econometrica , vol. 68, non. 2 (2000), 399–405.

P. McCullagh, Rééchantillonnage et matrices échangeables , Bernoulli , vol. 6, non. 2 (2000), 285-301.

EL Lehmann et JP Romano, Test d'hypothèses statistiques , 3e. ed., Springer (2005). [Chapitre 15: Méthodes générales pour les grands échantillons]


Le comportement du bootstrap de statistiques sur les commandes me semble raisonnable, étant donné que la distribution exponentielle a une "masse de points" similaire à zéro - Le mode d’une distribution exponentielle est 0, il semble donc raisonnable que la probabilité soit non nulle à la valeur la plus probable! Le bootstrap ressemblerait probablement davantage à une distribution géométrique qui est un analogue discret de l’exponentielle. Je ne prendrais pas ceci comme un "échec" du bootstrap ici - car la quantité estimée de se situe toujours dans l'intervalle appropriéθθX(n)
probabiliste

1
@ cardinal - la distribution asymptotique n'est pas le point de référence approprié - sauf si vous avez un échantillon infini. La distribution bootstrap doit être comparée à la distribution d'échantillons finis pour laquelle elle a été conçue. Ce que vous voulez montrer, c'est que lorsque le nombre d'itérations de bootstrap va à l'infini, la distribution de bootstrap converge vers la distribution d'échantillonnage fini . laisser est une solution approximative et non exacte. n
probabilityislogic

5
@ cardinal +1, j'ai déjà voté à la question, mais je tiens simplement à remercier pour une très bonne réponse, des exemples et des liens vers les articles.
Mpiktas

@probabilityislogic, bien sûr dans l'application générale de la théorie asymptotique dépend du taux de convergence, s'il est lent, alors il n'est pas applicable. Mais vous devez ensuite démontrer que le taux est lent, car je soupçonne que, par exemple, avec une distribution uniforme prenant la taille d'échantillon 100, vous rencontrerez les problèmes décrits par cardinal.
Mpiktas

3
@probabilityislogic, au début, je n'ai vu que le dernier de vos deux commentaires les plus récents. Pour résoudre le premier problème, vous pouvez voir les deux premières phrases de la section ci-dessus avec l'en-tête "Ce que cela signifie pour le bootstrap" d'échouer "", où cela est explicitement traité. Le bootstrap ne consiste pas à estimer le paramètre. Nous supposons que nous avons un bon moyen d'estimer le paramètre souhaité (dans ce cas, fonctionne bien). Le bootstrap consiste à connaître quelque chose sur la distribution du paramètre afin que nous puissions faire des inférences. Ici, le bootstrap obtient la distribution ( très! ) Mal. X(n)
cardinal

8

Le livre suivant contient un chapitre (Ch.9) consacré à "En cas d'échec du démarrage avec des solutions pour échecs":

MR Chernick, Méthodes Bootstrap. Guide pour les praticiens et les chercheurs , 2e éd. Hoboken NJ: Wiley-Interscience, 2008.

Les sujets sont:

  1. Trop petit d'une taille d'échantillon
  2. Distributions avec des moments infinis
  3. Estimation des valeurs extrêmes
  4. Sondage d'échantillonnage
  5. Séquences de données dépendantes de M
  6. Processus autorégressifs instables
  7. Dépendance à long terme

1
Avez-vous vu ce commentaire à une réponse dans ce fil? Incidemment, ce commentaire renvoie à une page Amazon du livre de Chernick; les critiques de lecteurs sont éclairantes.
whuber

@ Whuber Eh bien, je n'ai pas remarqué ce commentaire. Dois-je retirer ma réponse?
Sadeghd

1
Parce que votre réponse est plus détaillée que la référence dans le commentaire, elle a potentiellement une valeur: mais, conformément aux politiques et aux objectifs de SE, il serait agréable de la voir enrichie en expliquant pourquoi vous recommandez ce livre ou, mieux encore. ... pour y inclure un résumé des informations. Sinon, cela ajoute peu et devrait être supprimé ou converti en un commentaire à la question.
whuber

1

Le bootstrap naïf dépend de la taille de l'échantillon, de sorte que le CDF empirique pour les données est une bonne approximation du "vrai" CDF. Cela garantit que l’échantillonnage à partir du CDF empirique est très semblable à celui du "vrai" CDF. Le cas extrême est celui où vous n’avez échantillonné qu’un seul point de données - l’amorçage ne donne rien ici. Cela deviendra de plus en plus inutile à l'approche de ce cas dégénéré.

Le démarrage naïf n'échouera pas nécessairement dans l'analyse des séries chronologiques (bien que cela puisse s'avérer inefficace) - si vous modélisez la série à l'aide de fonctions de base de temps continu (telles que les polynômes de Legendre) pour un composant de tendance, et de fonctions sinus et cosinus de temps continu pour les fonctions cycliques. composants (plus le terme d'erreur de bruit normal). Ensuite, vous indiquez les périodes que vous avez échantillonnées dans la fonction de probabilité. Pas de catastrophe pour démarrer ici.

Toute corrélation automatique ou modèle ARIMA a une représentation dans ce format ci-dessus - ce modèle est simplement plus facile à utiliser et je pense comprendre et interpréter (cycles faciles à comprendre pour les fonctions sinus et cosinus, coefficients difficiles à comprendre pour un modèle ARIMA). Par exemple, la fonction d'auto-corrélation est la transformée de Fourier inverse du spectre de puissance d'une série temporelle.


@probabilityislogic -1, j'ai accidentellement voté la réponse plus tôt (blâme Opera mini) alors j'ai dû la modifier pour pouvoir voter par la baisse, je suis désolé d'avoir utilisé une telle tactique. Je l’ai fait uniquement parce que je n’avais pas aimé la réponse au début, mais je n’ai pas voté par vote parce que je voulais préparer mes arguments, ce que je donnerai dans le commentaire suivant.
Mpiktas

1
@probabilityislogic, pour les processus de série chronologique, le temps joue un rôle important, la distribution du vecteur est donc différente de . Le rééchantillonnage effectué dans un bootstrap naïf détruit cette structure. Ainsi, par exemple, si vous essayez d’adapter le modèle AR (1), après le rééchantillonnage, vous obtiendrez peut-être que vous essayez d’adapter comme , ce qui ne semble pas naturel. Si vous recherchez "série chronologique de démarrage" sur Google, le deuxième article donne un exemple de la façon dont l'estimation de la variance de la ...(Xt,Xt+1)(Xt+1,Xt)Y10ρY15
mpiktas

2
@probabilityislogic, serait-il possible pour vous de démontrer votre idée dans votre réponse pour une estimation bootstrap naïve de dans le modèle AR (1) ? Je ne pense pas que ce soit possible, d’où la raison fondamentale de la baisse du vote. Je serais heureux de me tromper. ρYt=ρYt1+ut
Mpiktas

1
@probabilityislogic, et? Quelle sera l'estimation de dans ce cas? Je suis désolé d'avoir harcelé, mais je ne vois vraiment pas comment vous pouvez montrer que le bootstrap naïf n'échouera pas dans ce cas. rho
Mpiktas

4
Mon livre ici un chapitre lorsque le bootstrap échoue et aussi un chapitre sur la façon dont l'amorce est appliquée dans les séries chronologiques. Pour les séries chronologiques, le bootstrap peut être appliqué aux résidus d'un modèle dans l'approche basée sur un modèle. L’autre approche de domaine temporel non paramétrique est le bootstrap par blocs, qui existe en de nombreux types.
Michael Chernick
En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.