est un test de Mann Whitney sur des données où les hypothèses ne sont pas satisfaites ou presque aussi puissant qu'un test t sur des données où les hypothèses sont satisfaites?
Une phrase comme «aussi puissant» ne fonctionne pas vraiment comme une déclaration générale.
La puissance n'est pas particulièrement comparable entre les différents modèles de distribution. La taille d'un effet donné a différentes significations dans différentes parties de la distribution. Imaginez que vous ayez une distribution qui est assez pointue, mais qui a une queue lourde; Dans quelle mesure dirons-nous qu'une taille particulière de déviation est similaire à quelque chose avec un centre beaucoup plus plat et une queue plus petite? Une petite déviation pourrait être à peu près aussi facile à détecter, mais une grande déviation pourrait être (par rapport à l'autre possibilité de distribution pour laquelle nous essayons de comparer la puissance) plus difficile.
Avec deux ensembles possibles de distributions normales, une paire avec un grand sd et une avec un petit sd, il est facile de dire «eh bien, la puissance évoluera simplement avec l'écart-type; si nous définissons notre taille d'effet en termes de nombre d'écarts-types, nous pouvons relier les deux courbes de puissance ».
Mais maintenant, avec des distributions de formes différentes , il n'y a pas de choix d'échelle évident. Nous devons faire des choix sur la façon de les comparer. Les choix que nous ferons détermineront leur "comparaison".
Par exemple, comment comparer la puissance lorsque les données sont Cauchy avec la puissance lorsque les données sont, par exemple, une version bêta (2,2)? Qu'est-ce qu'une taille d'effet comparable? Le Cauchy ci-dessous a plus de sa distribution entre -1 et 1 et moins de sa distribution entre -3 et 3 que l'autre. Par exemple, leurs plages interquartiles sont différentes. Quelle est notre base de comparaison?
Si vous pouvez résoudre cette énigme, considérez maintenant si l'une des distributions est asymétrique à gauche et l'autre est bimodale, ou l'une des innombrables autres possibilités.
Vous pouvez toujours calculer la puissance sous n'importe quel ensemble particulier d'hypothèses, mais la comparaison d'un test à travers différentes hypothèses de distribution plutôt que de deux tests sous une hypothèse de distribution donnée est conceptuellement très délicate.