lorsque j'ai exécuté quelques exemples, les valeurs de p pour rho et pour le test t de la corrélation de Pearson des rangs étaient toujours identiques, à l'exception des derniers chiffres
Eh bien, vous avez exécuté les mauvais exemples!
a = c(1,2,3,4,5,6,7,8,9)
b = c(1,2,3,4,5,6,7,8,90)
cor.test(a,b,method='pearson')
Pearson's product-moment correlation
data: a and b
t = 2.0528, df = 7, p-value = 0.0792
alternative hypothesis: true correlation is not equal to 0
95 percent confidence interval:
-0.08621009 0.90762506
sample estimates:
cor
0.6130088
cor.test(a,b,method='spearman')
Spearman's rank correlation rho
data: a and b
S = 0, p-value = 5.511e-06
alternative hypothesis: true rho is not equal to 0
sample estimates:
rho
1
a
b
ρb
A l' inverse, tout a
et b
avoir une corrélation de rang parfait, leur coefficient de corrélation de Pearson est inférieur à 1. Cela montre que la corrélation de Pearson ne reflète pas les rangs.
Une corrélation de Pearson reflète une fonction linéaire, une corrélation de rang simplement une fonction monotone. Dans le cas de données normales, les deux se ressemblent fortement, et je soupçonne que c'est pourquoi vos données ne montrent pas de grandes différences entre Spearman et Pearson.
Pour un exemple pratique, considérez ce qui suit; vous voulez voir si les personnes plus grandes pèsent plus. Oui, c'est une question idiote ... mais supposez simplement que c'est ce qui vous intéresse. Maintenant, la masse n'évolue pas linéairement avec le poids, car les personnes de grande taille sont également plus larges que les petites personnes; le poids n'est donc pas une fonction linéaire de la taille. Quelqu'un qui est 10% plus grand que vous est (en moyenne) plus de 10% plus lourd. C'est pourquoi l'indice de masse / corps utilise le cube dans le dénominateur.
Par conséquent, vous supposeriez une corrélation linéaire pour refléter de manière inexacte la relation taille / poids. En revanche, la corrélation de rang est insensible aux lois ennuyeuses de la physique et de la biologie dans ce cas; il ne reflète pas si les gens grossissent linéairement à mesure qu'ils gagnent en hauteur, il reflète simplement si les personnes plus grandes (plus haut rang sur une échelle) sont plus lourdes (plus haut rang sur l'autre échelle).
Un exemple plus typique pourrait être celui des classements de questionnaires de type Likert, tels que les personnes évaluant quelque chose comme "parfait / bon / décent / médiocre / mauvais / horrible". "parfait" est aussi loin d'être "décent" que "décent" est "mauvais" sur l'échelle , mais peut-on vraiment dire que la distance entre les deux est la même? Une corrélation linéaire n'est pas nécessairement appropriée. La corrélation de rang est plus naturelle.
Pour répondre plus directement à votre question: non, les valeurs de p pour les corrélations de Pearson et Spearman ne doivent pas être calculées différemment . Beaucoup est différent sur les deux, conceptuellement et numériquement, mais si la statistique de test est équivalente, la valeur p sera équivalente.
Sur la question d'une hypothèse de normalité dans la corrélation de Pearson, voir ceci .
Plus généralement, d' autres personnes ont élaboré beaucoup mieux que moi concernant le sujet des corrélations paramétriques vs non paramétriques (voir aussi ici ), et ce que cela signifie en ce qui concerne les hypothèses de distribution.