J'ai deux échantillons fortement asymétriques et j'essaie d'utiliser le bootstrap pour comparer leurs moyennes en utilisant la statistique t.
Quelle est la bonne procédure pour le faire?
Le processus que j'utilise
Je m'inquiète de l'opportunité d'utiliser l'erreur type des données originales / observées à l'étape finale lorsque je sais que ce n'est pas normalement distribué.
Voici mes étapes:
- Bootstrap - échantillon aléatoire avec remplacement (N = 1000)
- Calculer la statistique t pour chaque bootstrap pour créer une distribution t :
- Estimer les intervalles de confiance t en obtenant et 1 - α / 2 centiles de la distribution t
Obtenez des intervalles de confiance via:
C I U = ( ¯ X 1 - ¯ X 2 ) + T _ C I U . S E o r i g i n a l où
- Regardez où se situent les intervalles de confiance pour déterminer s'il y a une différence significative dans les moyennes (c.-à-d. Non nulle)
J'ai également examiné la somme des rangs de Wilcoxon, mais elle ne donne pas de résultats très raisonnables en raison de la distribution très fortement asymétrique (par exemple, le 75e == 95e centile). Pour cette raison, je voudrais explorer davantage le test t amorcé.
Mes questions sont donc:
- Est-ce une méthodologie appropriée?
- Est-il approprié d'utiliser le SE des données observées lorsque je sais qu'elles sont fortement biaisées?
Duplication possible: quelle méthode est préférée, un test d'amorçage ou un test non paramétrique basé sur le classement?