J'essaie d'en choisir un parmi ces deux tests pour analyser les données appariées. Quelqu'un connaît-il des règles générales sur lesquelles choisir en général?
J'essaie d'en choisir un parmi ces deux tests pour analyser les données appariées. Quelqu'un connaît-il des règles générales sur lesquelles choisir en général?
Réponses:
J'essaie d'en choisir un parmi ces deux tests pour analyser les données appariées. Quelqu'un connaît-il des règles générales sur lesquelles choisir en général?
Le test de rang signé comporte une hypothèse de symétrie des différences sous le nul que le test de signe n'a pas besoin. (Cette hypothèse est nécessaire pour que les permutations des signes attachés aux rangs de différences non signés soient également probables.)
En revanche, s'il y a une quasi-symétrie dans la population et que la queue n'est pas très lourde, le rang signé devrait avoir plus de puissance.
[Cela ne doit pas être considéré comme un conseil pour choisir entre eux sur la base de l'échantillon ; en général, cela conduit à des propriétés de test différentes de la valeur nominale (les tests peuvent être biaisés, les niveaux de signification réels ne sont plus ce qu'ils semblent être, les valeurs de p calculées ne représentent pas de vraies valeurs de p, etc.). Au lieu de cela, dans la mesure du possible, les caractéristiques doivent être évaluées sur la base de connaissances externes à l'échantillon auquel le test est appliqué - que ce soit par connaissance du domaine, familiarité avec d'autres ensembles de données comme celui-ci, échantillonnage, ...]
Dans mon cas, le test de somme de rang a la plus grande valeur de p, le test de signe est le moyen, le rang signé est le plus petit. Par conséquent, il a plus de pouvoir.
Ce n'est pas ainsi que vous décidez qu'un test a plus de puissance - une valeur de p inférieure pour un échantillon peut simplement être due aux caprices de cet échantillon, alors que la puissance concerne le comportement de tous les échantillons aléatoires tirés de la même population.
De la même manière, nous pourrions calculer le taux de rejet pour une séquence de populations avec un emplacement différent * des différences de paires et obtenir une courbe de puissance entière. Ensuite, une «puissance plus élevée» correspondrait à la courbe de puissance entière (ou presque entièrement, en notant que les deux devraient être au même niveau de signification) pour un test placé au-dessus de l'autre.
* vous pouvez le considérer comme une médiane pour la présente discussion - alors que l'estimateur pour le test de rang signé est la médiane des moyennes par paire des différences de paires, sous l'hypothèse de symétrie, l'estimateur de localisation devrait également être une estimation appropriée de la paire médiane différence.
Voici une question connexe Comment choisir entre un test t ou un test non paramétrique, par exemple Wilcoxon dans de petits échantillons . L'une des réponses comprend une (brève) discussion de la question actuelle.