Oui, ce serait toujours une erreur.
Voici une figure très simple montrant quatre situations différentes. Dans chaque cas, les points rouges représentent les femmes, les points bleus représentent les hommes, l'axe horizontal représente la taille du cerveau et l'axe vertical représente le QI. J'ai généré les quatre ensembles de données tels que:
il y a toujours la même différence de taille moyenne du cerveau entre les hommes ( ) et les femmes ( 28 - les unités sont arbitraires). Ce sont des moyennes de population, mais cette différence est suffisamment grande pour être statistiquement significative avec toute taille d'échantillon raisonnable;2228
il y a toujours une différence nulle dans le QI moyen entre les hommes et les femmes (tous deux ), et aussi une corrélation nulle entre le sexe et le QI;100
la force de corrélation entre la taille du cerveau et le QI varie comme indiqué sur la figure.
Dans la sous-intrigue en haut à gauche, la corrélation intra-sexe (calculée séparément pour les hommes et séparément pour les femmes, puis en moyenne) est de , comme dans votre citation. Dans la sous-placette supérieure droite, la corrélation globale (sur les hommes et les femmes ensemble) est de 0,3 . Notez que votre devis ne précise pas à quoi se réfère le nombre de 0,33 . Dans la sous-intrigue en bas à gauche, la corrélation intra-sexe est de 0,9 , comme dans votre exemple hypothétique; dans la sous-placette inférieure droite, la corrélation globale est de 0,9 .0,30,30,330,90,9
Vous pouvez donc avoir n'importe quelle valeur de corrélation, et peu importe qu'elle soit calculée globalement ou au sein d'un groupe. Quel que soit le coefficient de corrélation, il est fort possible qu'il n'y ait aucune corrélation entre le sexe et le QI et aucune différence entre les sexes dans le QI moyen.
Explorer la non-transitivité
Explorons tout l'espace des possibilités, en suivant l'approche suggérée par @kjetil. Supposons que vous ayez trois variables et (sans perte de généralité) supposons que la corrélation entre x 1 et x 2 est a > 0 et la corrélation entre x 2 et x 3 est b > 0 . La question est: quelle est la valeur positive minimale possible de la corrélation λ entre x 1 et x 3X1, x2, x3X1X2a > 0X2X3b > 0λX1X3? Est - il parfois avoir à être positif, ou peut - il être toujours égale à zéro?
La matrice de corrélation est et elle doit avoir un déterminant non négatif, c'est-à-dire d e t R = - λ 2 + 2 a b λ - ( a 2 + b 2 - 1 ) ≥ 0 , ce qui signifie que λ doit se situer entre a b ± √
R = ⎛⎝⎜1uneλune1bλb1⎞⎠⎟
d e t R =- λ2+ 2 a b λ - ( a2+ b2- 1 ) ≥ 0 ,
λSi les deux racines sont positives, la valeur minimale possible de
λest égale à la plus petite racine (et
λdoit être positif!). Si zéro est entre ces deux racines, alors
λpeut être nul.
a b ± ( 1 - a2) ( 1 - b2)-------------√.
λλλ
Nous pouvons résoudre ce problème numériquement et tracer la valeur positive minimale possible de pour différents a et b :λuneb
De manière informelle, nous pourrions dire que les corrélations seraient transitives si étant donné que et b > 0 , on pourrait conclure que λ > 0 . Nous voyons que pour la plupart des valeurs a et b , λ peut être nul, ce qui signifie que les corrélations sont non transitives. Cependant, pour certaines valeurs suffisamment élevées de a et b , la corrélation λ doit être positive , ce qui signifie qu'il existe "un certain degré de transitivité" après tout, mais limité à des corrélations très élevées uniquement. Notez que les deux corrélations a et ba > 0b > 0λ > 0unebλunebλ uneb doivent être élevés.
On peut trouver une condition précise pour cette "transitivité": comme mentionné ci-dessus, la plus petite racine doit être positive, c'est -à- dire , ce qui équivaut àa2+b2>1. Ceci est une équation d'un cercle! Et en effet, si vous regardez la figure ci-dessus, vous remarquerez que la région bleue forme un quart de cercle.a b - ( 1 - a2) ( 1 - b2)-------------√> 0une2+ b2> 1
Dans votre exemple spécifique, la corrélation entre le sexe et la taille du cerveau est assez modérée (peut être a = 0,5 ) et la corrélation entre la taille du cerveau et le QI est b = 0,33 , ce qui est fermement dans la région bleue ( a 2 + b 2 < 1 ), ce qui signifie que λ peut être positif, négatif ou nul.a = 0,5b = 0,33une2+ b2< 1λ
Chiffre pertinent de l'étude originale
Vous vouliez éviter de discuter de genre et de cervelle, mais je ne peux m'empêcher de souligner qu'en regardant la figure complète de l'article original ( Gur et al. 1999 ), on peut voir que s'il n'y a pas de différence de genre dans le score de QI verbal, il y a une différence évidente et significative dans le score de QI spatial! Comparer les sous-parcelles D et F.