Disons que j'ai deux conditions, et ma taille d'échantillon pour les deux conditions est extrêmement faible. Disons que je n'ai que 14 observations dans la première condition et 11 dans l'autre. Je veux utiliser le test t pour tester si les différences moyennes sont significativement différentes les unes des autres.
Tout d'abord, je suis un peu confus quant à l'hypothèse de normalité du test t, ce qui pourrait être la raison pour laquelle je ne reçois pas totalement le bootstrap. Le test t suppose-t-il que (A) les données sont échantillonnées à partir d'une population normale, ou (B) que vos distributions d'échantillons ont des propriétés gaussiennes? Si c'est (B) alors ce n'est pas vraiment une hypothèse, non? Vous pouvez simplement tracer un histogramme de vos données et voir si c'est normal ou non. Si ma taille d'échantillon est faible cependant, je n'aurai pas assez de points de données pour voir si ma distribution d'échantillons est normale.
C'est là que je pense que le bootstrapping entre en jeu. Je peux bootstrap pour voir si mon échantillon est normal, non? Au début, je pensais que l'amorçage entraînerait toujours une distribution normale, mais ce n'est pas le cas (le rééchantillonnage d'amorçage peut-il être utilisé pour calculer un intervalle de confiance pour la variance d'un ensemble de données? Statexchange statexchange ). Donc, une des raisons pour lesquelles vous voudriez bootstrap est d'être plus certain de la normalité de vos échantillons de données, n'est-ce pas?
À ce stade, je deviens complètement confus. Si j'effectue un test t dans R avec la fonction t.test et que je mets les vecteurs d'échantillonnage bootstrap en tant que deux échantillons indépendants, ma valeur t devient simplement incroyablement significative. Suis-je pas en train de faire le test t bootstrapped à droite? Je ne dois pas, parce que tout amorçage fait simplement augmenter ma valeur t, cela ne se produirait-il pas dans tous les cas? Les gens n'effectuent-ils pas un test t sur les échantillons amorcés?
Enfin, quel est l'avantage de calculer les intervalles de confiance sur un bootstrap par rapport au calcul des intervalles de confiance sur notre échantillon d'origine? Qu'est-ce que ces intervalles de confiance me disent que les intervalles de confiance sur les données de l'échantillon d'origine ne le font pas?
Je suppose que je suis confus sur (A) pourquoi utiliser un bootstrap si cela ne fait que rendre ma valeur t plus significative, (B) incertain de la bonne façon d'utiliser le bootstrapping lors de l'exécution d'un échantillon t-test indépendant, et (C) incertain comment signaler la justification, l'exécution et les résultats du bootstrap dans des situations de test t indépendantes.