Le relecteur aurait dû vous dire pourquoi le spearman n'est pas approprié. En voici une version: Soit les données ( Z i , I i ) où Z est la variable mesurée et I, l'indicateur de genre, soit 0 (homme), 1 (femme). Puis de Spearman de ρ est calculée sur la base des rangs de Z , I , respectivement. Puisqu'il n'y a que deux valeurs possibles pour l'indicateur I , il y aura beaucoup de liens, donc cette formule n'est pas appropriée. Si vous remplacez rang par rang moyen, vous n'obtiendrez que deux valeurs différentes, une pour les hommes et une autre pour les femmes. Alors ρρ(Zi,Ii)ZIρZ,IIρdeviendra fondamentalement une version redimensionnée des rangs moyens entre les deux groupes. Il serait plus simple (plus interprétable) de simplement comparer les moyens! Une autre approche est la suivante.
Soit les observations de la variable continue chez les hommes, Y 1 , … , Y m identiques chez les femmes. Maintenant, si les distributions de X et de Y sont identiques, alors P ( X > Y ) sera égal à 0,5 (supposons que la distribution soit purement continue, il n'y a donc pas de liens). Dans le cas général, définissez
θ = P ( X > Y )
où X est un tirage au sort parmi les hommes, YX1,…,XnY1,…,YmXYP(X>Y)
θ=P(X>Y)
XYchez les femmes. Pouvons-nous estimer
partir de notre échantillon? Formez toutes les paires
( X i , Y j ) (sans liens) et comptez pour combien nous avons "l'homme est plus grand" (
X i > Y j ) (
M ) et pour combien de "femme est plus grande" (
X i < Y j ) (
W ). Alors une estimation sur
9 de
θ est
Mθ(Xi,Yj)Xi>YjMXi<YjWθ
C'est une mesure raisonnable de corrélation! (S'il n'y a que quelques liens, ignorez-les simplement). Mais je ne sais pas comment ça s'appelle, si ça porte un nom. Celui-ci peut être proche:
https://en.wikipedia.org/wiki/Goodman_and_Kruskal%27s_gammaMM+W