Dans quels cas doit-on préférer l'un à l'autre?
J'ai trouvé quelqu'un qui revendique un avantage pour Kendall, pour des raisons pédagogiques , y a-t-il d'autres raisons?
Dans quels cas doit-on préférer l'un à l'autre?
J'ai trouvé quelqu'un qui revendique un avantage pour Kendall, pour des raisons pédagogiques , y a-t-il d'autres raisons?
Réponses:
J'ai constaté que la corrélation de Spearman est principalement utilisée à la place de la corrélation linéaire habituelle lorsque vous travaillez avec des scores à valeurs entières sur une échelle de mesure, lorsqu'il existe un nombre modéré de scores possibles ou lorsque vous ne voulez pas vous fier aux hypothèses concernant les relations à deux variables . Par rapport au coefficient de Pearson, l'interprétation du tau de Kendall me semble moins directe que celle du rho de Spearman, en ce sens qu'elle quantifie la différence entre le% de paires concordantes et discordantes parmi tous les événements par paires possibles. D'après moi, le tau de Kendall ressemble plus à Goodman-Kruskal Gamma .
Je viens de parcourir un article de Larry Winner dans J. Statistics Educ. (2006) qui traite de l'utilisation des deux mesures, Résultats de la Coupe NASCAR Winston pour 1975-2003 .
J'ai également trouvé la réponse de @onestop sur la corrélation de Pearson ou de Spearman avec des données non normales intéressante à cet égard.
Fait à noter, le tau de Kendall (la une version) dispose d'une connexion à Somers de D (et le C de Harrell) utilisé pour la modélisation prédictive (voir par exemple, interprétation de Somers de D en quatre modèles simples par RB Newson et référence 6 dans celle - ci, et les articles de Newson publié dans le Stata Journal 2006). Un aperçu des tests de classement par somme est fourni dans Calcul efficace des intervalles de confiance de Jackknife pour les statistiques de rang , publié dans le JSS (2006).
Je me réfère l'honorable monsieur à ma réponse précédente : « ... les intervalles de confiance pour r de Spearman de S sont moins fiables et moins interprétables que les intervalles de confiance pour les paramètres de T pour -Kendall », selon Kendall & Gibbons (1990).
Encore une réponse quelque peu philosophique; La différence fondamentale réside dans le fait que Spearman's Rho tente d'élargir l'idée de R ^ 2 (= "explication de la variance") aux interactions non linéaires, tandis que le test Tau de Kendall est plutôt destiné à être une statistique de test pour le test de corrélation non linéaire. Donc, Tau devrait être utilisé pour tester les corrélations non linéaires, Rho en tant qu'extension R (ou pour les personnes familiarisées avec R ^ 2 - expliquer Tau à un public non méfiant dans un temps limité est douloureux).
Voici une citation d'Andrew Gilpin (1993) qui prône le τ de Kendall sur le ρ de Spearman pour des raisons théoriques:
"Le [Kendall ] approche une distribution normale plus rapidement que , puisque , la taille de l'échantillon augmente; et est aussi plus facile à calculer d'un point de vue mathématique, en particulier lorsque des liens sont présents."
Gilpin, AR (1993). Tableau de conversion du Tau de Kendall en Rho de Spearman dans le contexte des mesures de l'ampleur de l'effet pour la méta-analyse. Mesure éducative et psychologique, 53 (1), 87-92.
FWIW, une citation de Myers & Well (plan de recherche et analyses statistiques, deuxième édition, 2003, p. 510). Si vous vous souciez encore des valeurs p;
Seigel et Castellan (1988, Statistiques non paramétriques pour les sciences du comportement) soulignent que, bien que et Spearman aient généralement des valeurs différentes lorsqu’ils sont calculés pour le même ensemble de données, lorsque les tests de signification pour et Spearman sont basés sur leurs distributions d'échantillonnage, ils donneront les mêmes p- valeurs.