Avertissement: si vous trouvez que cette question est trop similaire à une autre, je suis heureux qu'elle soit fusionnée. Cependant, je n'ai pas trouvé de réponse satisfaisante ailleurs (et je n'ai pas encore la "réputation" de commenter ou de voter), donc j'ai pensé qu'il serait préférable de poser moi-même une nouvelle question.
Ma question est la suivante. Pour chacun des 12 sujets humains, j'ai calculé un coefficient de corrélation (rho de Spearman) entre 6 niveaux d'une variable indépendante X, et les observations correspondantes d'une variable dépendante Y. (Remarque: les niveaux de X ne sont pas égaux entre les sujets.) Mon l'hypothèse nulle est que dans la population générale, cette corrélation est égale à zéro. J'ai testé cette hypothèse de deux manières:
Utilisation d'un test t à un échantillon sur les coefficients de corrélation obtenus à partir de mes 12 sujets.
En centrant mes niveaux de X et mes observations de Y de telle sorte que pour chaque participant, moyenne (X) = 0 et moyenne (Y) = 0, puis calcul d'une corrélation sur les données agrégées (72 niveaux de X et 72 observations de Y) .
Maintenant, en lisant sur le travail avec les coefficients de corrélation (ici et ailleurs), j'ai commencé à douter de la validité de la première approche. En particulier, j'ai vu l'équation suivante apparaître à plusieurs endroits, présentée (apparemment) comme un test t pour les coefficients de corrélation moyens:
où serait le coefficient de corrélation moyen (et supposons que nous l'avons obtenu en utilisant d'abord la transformation de Fisher sur les coefficients par sujet) et le nombre d'observations. Intuitivement, cela me semble faux car il ne comprend aucune mesure de la variabilité entre les sujets. En d'autres termes, si j'avais 3 coefficients de corrélation, j'obtiendrais la même statistique t, qu'ils soient [0,1, 0,5, 0,9] ou [0,45 0,5 0,55] ou n'importe quelle plage de valeurs avec la même moyenne (et )n n = 3
Je soupçonne donc que l'équation ci-dessus ne s'applique pas en fait lors du test de la signification d'une moyenne de coefficients de corrélation, mais lors du test de la signification d'un seul coefficient de corrélation basé sur observations de 2 variables.
Quelqu'un ici pourrait-il confirmer cette intuition ou expliquer pourquoi elle est fausse? De plus, si cette formule ne s'applique pas à mon cas, quelqu'un connaît-il / la bonne approche? Ou peut-être que mon propre numéro de test 2 est déjà valide? Toute aide est grandement appréciée (y compris les pointeurs vers des réponses précédentes que j'ai peut-être manquées ou mal interprétées).