(Merci beaucoup pour les réponses rapides! J'ai mal fait de poser la question, alors laissez-moi réessayer.)
Je ne sais pas comment déterminer si la différence entre deux corrélations de Spearman est statistiquement significative. J'aimerais savoir comment le découvrir.
La raison pour laquelle je voulais le savoir est que dans l'article suivant: Interprétation sémantique basée sur Wikipedia pour le traitement du langage naturel , par Gabrilovich et Markovitch ( Journal of Artificial Intelligence Research 34 (2009) 443-498).
Dans le tableau 2 (p. 457), les auteurs montrent que leur méthode (ESA-Wikipedia) atteint une corrélation de Spearman plus élevée et statistiquement significative que les autres méthodes, et je voudrais faire de même pour montrer que ma méthode est meilleure que la précédente méthodes pour certains problèmes.
Je ne sais pas comment ils ont calculé la signification statistique, et j'aimerais savoir. L'auteur de l'article a déclaré que la corrélation de rang de Spearman était traitée comme la corrélation de Pearson. Je ne sais pas si c'est la bonne façon de procéder. J'ai deux corrélations de Spearman et j'aimerais savoir si la différence entre elles est statistiquement significative ou non.
Je suis conscient que les sites Web, tels que http://faculty.vassar.edu/lowry/rdiff.html , fournissent une calculatrice en ligne pour obtenir la différence entre deux corrélations de Pearson. Je n'arrive pas à trouver une calculatrice en ligne similaire pour la différence entre deux corrélations de Spearman.
Une solution à partir du lien fourni par Peter Flom
REMARQUE: les procédures prennent uniquement en charge les corrélations de Spearman inférieures à 0,6.
Soit = la transformée de Fisher de la corrélation observée de série A , z B = la transformée de Fisher la corrélation observée ensemble B .
Pour , soit y A i = n z A - ( n - 1 ) z A ′ i , où z A ′ i est la transformée de Fisher de l'ensemble A de la corrélation à gauche obtenue par suppression ( x i , y i ) , reclassement et recalcul de la corrélation. (Chaque z A ′ i est basé sur n - paires; chaque suppression est temporaire, pour que je,non permanent.) Répéter pour voir B .
est la transformée de Fisher avec jackknif. Répétezopération pour ensembleB.
est la variance de ˉ y A . Répétezopération pour ensemble B .
Utilisez un test hétéroscédastique (Welch-Satterthwaite) pour comparer les deux estimations jackknifed:
oùnAetnBsont le nombre d'échantillons de l'ensembleAetBrespectivement.
Avant la première modification
J'ai un ensemble de classement humain (HUMAN-RANKING), un ensemble de classement généré par la méthode populaire actuellement utilisée (PRESENT-RANKING), et enfin un ensemble de classement généré par ma méthode proposée (MY-RANKING) .
J'ai calculé la corrélation de Spearman entre HUMAN-RANKING et PRESENT-RANKING. Permettez-moi d'appeler cela: HUMAN-PRESENT-SPEARMAN.
J'ai ensuite découvert la corrélation du Spearman entre HUMAN-RANKING et MY-RANKING. Permettez-moi d'appeler cela: HUMAN-MY-SPEARMAN.
Comment savoir si la différence entre HUMAN-MY-SPEARMAN et HUMAN-PRESENT-SPEARMAN est statistiquement significative?