Comment choisir entre le test de signe et le test de rang signé de Wilcoxon?

J'essaie d'en choisir un parmi ces deux tests pour analyser les données appariées. Quelqu'un connaît-il des règles générales sur lesquelles choisir en général?

— Sheldon
source

La réponse de Silverfish y touche juste (à peine). Cette question est assez générale, je me demande si nous pourrions en tolérer une plus spécifique.

— Glen_b -Reinstate Monica

Sheldon - le test de classement signé comporte une hypothèse sur la symétrie des différences que le test de signe ne fait pas. En revanche, s'il y a quasi-symétrie et que la queue n'est pas très lourde, le rang signé devrait avoir plus de puissance.

— Glen_b -Reinstate Monica

Je suis d'accord. Dans mon cas, le test de somme de rang a la plus grande valeur de p, le test de signe est le moyen, le rang signé est le plus petit. Par conséquent, il a plus de pouvoir.

— Sheldon

@Sheldon Non, ce n'est pas ainsi que vous décidez qu'un test a plus de puissance - une valeur de p inférieure pour un échantillon peut simplement être due aux caprices de cet échantillon, alors que la puissance concerne le comportement de tous les échantillons aléatoires tirés de la même population. Je ferais mieux d'écrire une réponse qui développe les commentaires précédents, explique ce que signifie avoir plus de pouvoir et explique certaines des circonstances dans lesquelles chacun pourrait faire mieux.

— Glen_b -Reinstate Monica

@Glen_b, je dirais qu'à l'heure actuelle, la considération la plus importante est celle qui sera la plus utile pour les futurs lecteurs. Je pense que quiconque cherche un test de signe vs un test de Wilcoxon et trouve ce fil, bénéficiera beaucoup plus de la lecture de votre réponse spécifique ici que d'être redirigé vers ce méga-fil où ils risquent de se perdre et de ne jamais trouver de réponse.

— amoeba

J'essaie d'en choisir un parmi ces deux tests pour analyser les données appariées. Quelqu'un connaît-il des règles générales sur lesquelles choisir en général?

Le test de rang signé comporte une hypothèse de symétrie des différences sous le nul que le test de signe n'a pas besoin. (Cette hypothèse est nécessaire pour que les permutations des signes attachés aux rangs de différences non signés soient également probables.)

En revanche, s'il y a une quasi-symétrie dans la population et que la queue n'est pas très lourde, le rang signé devrait avoir plus de puissance.

[Cela ne doit pas être considéré comme un conseil pour choisir entre eux sur la base de l'échantillon ; en général, cela conduit à des propriétés de test différentes de la valeur nominale (les tests peuvent être biaisés, les niveaux de signification réels ne sont plus ce qu'ils semblent être, les valeurs de p calculées ne représentent pas de vraies valeurs de p, etc.). Au lieu de cela, dans la mesure du possible, les caractéristiques doivent être évaluées sur la base de connaissances externes à l'échantillon auquel le test est appliqué - que ce soit par connaissance du domaine, familiarité avec d'autres ensembles de données comme celui-ci, échantillonnage, ...]

Dans mon cas, le test de somme de rang a la plus grande valeur de p, le test de signe est le moyen, le rang signé est le plus petit. Par conséquent, il a plus de pouvoir.

Ce n'est pas ainsi que vous décidez qu'un test a plus de puissance - une valeur de p inférieure pour un échantillon peut simplement être due aux caprices de cet échantillon, alors que la puissance concerne le comportement de tous les échantillons aléatoires tirés de la même population.

$H_0$

De la même manière, nous pourrions calculer le taux de rejet pour une séquence de populations avec un emplacement différent * des différences de paires et obtenir une courbe de puissance entière. Ensuite, une «puissance plus élevée» correspondrait à la courbe de puissance entière (ou presque entièrement, en notant que les deux devraient être au même niveau de signification) pour un test placé au-dessus de l'autre.

* vous pouvez le considérer comme une médiane pour la présente discussion - alors que l'estimateur pour le test de rang signé est la médiane des moyennes par paire des différences de paires, sous l'hypothèse de symétrie, l'estimateur de localisation devrait également être une estimation appropriée de la paire médiane différence.

Voici une question connexe Comment choisir entre un test t ou un test non paramétrique, par exemple Wilcoxon dans de petits échantillons . L'une des réponses comprend une (brève) discussion de la question actuelle.

— Glen_b -Reinstate Monica
source

Merci pour la clarification. Je pense que le message à retenir le plus important est l'hypothèse de symétrie des différences pour le test de rang signé, qui est violée dans mon cas. J'ai l'impression qu'à part vérifier si les critères de symétrie sont satisfaits, il n'y a aucun moyen de savoir quel test est incorrect. Il semble plutôt raisonnable de dire laquelle est la plus appropriée.

— Sheldon

@Sheldon Si vous n'êtes pas sûr que les conditions du test soient proches de la réalité, vous ne devez généralement pas supposer qu'elles le sont. Autrement dit, le test des signes serait peut-être une meilleure idée. J'espère ajouter quelques informations supplémentaires à ma réponse lorsque j'en aurai l'occasion.

— Glen_b -Reinstate Monica