Analyse de puissance pour le test Kruskal-Wallis ou Mann-Whitney U utilisant R?

Est-il possible d'effectuer une analyse de puissance pour le test Kruskal-Wallis et Mann-Whitney U? Si oui, existe-t-il des packages / fonctions R qui l'exécutent?

r nonparametric power-analysis kruskal-wallis

— Giorgio Spedicato
source

Cela peut être utile: stats.stackexchange.com/questions/65808/…

Dans R. il y a un paquet pwr. Mais il ne fait pas le test de puissance de Kruskal-Wallis.

— Hong Zhan

Il est certainement possible de calculer la puissance.

Pour être plus précis - si vous faites suffisamment d'hypothèses pour obtenir une situation dans laquelle vous pouvez calculer (d'une certaine manière) la probabilité de rejet, vous pouvez calculer la puissance.

Dans le Wilcoxon-Mann-Whitney, si (par exemple) vous assumez les formes de distribution (faites une hypothèse sur les formes de distribution) et faites une hypothèse sur les échelles (spreads) et les valeurs spécifiques des emplacements ou la différence des emplacements , vous pourriez être en mesure de calculer la puissance soit algébriquement soit par intégration numérique; à défaut, vous pouvez simuler le taux de rejet.

Ainsi, par exemple, si nous supposons un échantillonnage à partir de distributions de avec une différence d'emplacement spécifiée (normalisée pour une échelle commune), alors étant donné la taille des échantillons, nous pourrions simuler de nombreux ensembles de données satisfaisant à toutes ces conditions et ainsi obtenir une estimation du taux de rejet. Supposons donc que nous ayons deux échantillons de distributions (famille d'échelles de localisation) avec une échelle unitaire ( ) - sans perte de généralité - et avec une différence de localisation . Encore une fois, sans perte de généralité, nous pourrions prendre $t_5$ $t_5$ $\sigma=1$ $\delta=\mu_2-\mu_1=1$ $\mu_1=0$ . Ensuite, pour une taille d'échantillon spécifiée - (disons) - nous pouvons simuler les observations et donc la puissance pour cette valeur particulière de (c'est-à-dire ). Voici un exemple rapide dans R: $n_1=6,n_2=9$ $\delta/\sigma$ $1$

n1=6;n2=9;tdf=5;delta=1;al=0.05;nsim=10000
res = replicate(nsim,{y1=rt(n1,tdf);y2=rt(n2,tdf)+delta;wilcox.test(y1,y2)$p.value<=al})
mean(res)  # res will be logical ("TRUE" = reject); mean is rej rate

$n$ $\delta$

En le faisant pour de nombreuses valeurs du décalage d'emplacement, vous pouvez même obtenir une courbe de puissance pour cet ensemble de circonstances lorsque le décalage d'emplacement change si vous le souhaitez.

$n_1$ $n_2$ $\sigma^2$ $\delta/\sigma$ $\delta$ $n$ $n$ $1-b_i$ $\delta=\delta_i$ $\Phi^{-1}(1-b)$ $\delta$ $\delta$ $\delta$ $n$ $\delta$

$P(Y_2>Y_1)$

Notez que bien que ces tests soient sans distribution (pour les distributions continues) sous le zéro, le comportement est différent selon différentes hypothèses de distribution pour les alternatives.

La situation pour Kruskal-Wallis est similaire, mais vous avez plus de changements d'emplacement (ou toute autre situation que vous regardez) à spécifier.

Le tracé de cette réponse montre une comparaison d'une courbe de puissance pour un test t apparié avec une puissance simulée pour un test de rang signé pour une taille d'échantillon particulière, à travers une variété de décalages d'emplacement normalisés pour l'échantillonnage à partir de distributions normales avec une corrélation spécifiée entre les paires. Des calculs similaires peuvent être effectués pour le Mann-Whitney et le Kruskal-Wallis.

— Glen_b -Reinstate Monica
source