valeur p comme distance?


8

Les valeurs de p entre plusieurs tests par paire peuvent-elles être considérées comme une mesure de similitude / distance et une mise à l'échelle multidimensionnelle peut-elle être appliquée sur une matrice de paires de valeurs de p pour réduire la dimensionnalité? C'est une question douce, mais quel serait le plus gros problème ici, et comment pourrait-on mieux le surmonter? (ex: inégalité triangulaire?)


2
Ma réponse courte à votre première question sur la "distance de similitude" serait Non, vous pouvez vous référer à une question similaire sur un sujet différent ici: stats.stackexchange.com/questions/32890/… . Ces messages suggèrent donc d'autres mesures de «divergence» ou de distance. Je suppose qu'il vaut mieux d'abord répondre à votre première question.
JDav

Réponses:



3

Si toutes les "vraies distances" sont égales à 0, alors les valeurs de p suivront une distribution uniforme et ne seront que des distances aléatoires et incorrectes.
Si les distances réelles ne sont pas égales à 0, vous avez toujours des problèmes d'échelle où une statistique de test peut être plus significative. Les valeurs p de 0,9 et 0,6 ne sont pas très différentes dans l'interprétation tandis que les valeurs p de 0,06 et 0,01 sont assez différentes dans l'interprétation, mais les algorithmes mds mettraient plus de distance entre les premiers que les derniers. Vous devriez également considérer la puissance, vous pouvez avoir 2 groupes qui ont une très petite distance entre eux, mais de grandes tailles d'échantillon, donc vous obtenez une petite valeur de p; puis une autre paire avec une grande différence entre eux, mais en raison de la petite taille de l'échantillon (faible puissance), vous obtenez une valeur p plus grande.


2

Je crois que la réponse est oui.

On pourrait penser à la "similitude" entre deux variables à mesurer par (disons) corrélation. Et pour que la valeur de p soit la signification de la corrélation différente de 0. Dans un tel cas, une petite valeur de p (proche de zéro) est celle qui reflète une grande distance ("différence") entre les variables.

Vous pouvez transformer les valeurs de p en scores z (où leur "distance" devra prendre la direction "habituelle"), et voir si les méthodes que vous avez mentionnées auront un sens à cet égard ...


1

Je ne sais pas ce que vous entendez par "valeurs p entre plusieurs tests par paire". La valeur de p est une mesure de la probabilité / improbabilité d'un test particulier de voir une valeur comme extrême ou plus extrême que ce qui a été réellement observé si l'hypothèse nulle est vraie. Lors d'un test par paire, il n'y a pas de connexion particulière entre une valeur p et une autre. Je ne vois pas comment des valeurs de p pourraient être considérées comme une mesure de similitude entre les tests par paires.

En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.