Quelqu'un peut-il illustrer comment il peut y avoir dépendance et covariance nulle?


12

Quelqu'un peut-il illustrer, comme le fait Greg, mais plus en détail, comment les variables aléatoires peuvent être dépendantes, mais ont une covariance nulle? Greg, une affiche ici, donne un exemple en utilisant un cercle ici .

Quelqu'un peut-il expliquer ce processus plus en détail en utilisant une séquence d'étapes qui illustrent le processus à plusieurs étapes?

De plus, si vous connaissez un exemple de psychologie, veuillez illustrer ce concept avec un exemple connexe. Veuillez être très précis et séquentiel dans votre explication, et indiquer également quelles pourraient être les conséquences.


Un lien vers l'article auquel vous vous référez serait utile.
gui11aume

1
Je suis sûr que le sujet est ici: stats.stackexchange.com/questions/12842/… et la réponse de Greg (Snow) est ici: stats.stackexchange.com/a/12898/2073
Andy McKenzie

Au début, je pensais que la fermeture de cette question était correcte, mais je pense que cela pose peut-être une question subtilement différente d'ici stats.stackexchange.com/questions/12842/… puisque ce fil vient de demander des exemples mathématiques, alors que cette question semble chercher à comprendre exactement pourquoi les deux ne sont pas équivalents
Macro

Réponses:


21

L'idée de base ici est que la covariance ne mesure qu'un type particulier de dépendance , donc les deux ne sont pas équivalents. Plus précisément,

  • La covariance est une mesure de la relation linéaire entre deux variables. Si deux variables sont liées de façon non linéaire, cela ne sera pas reflété dans la covariance. Une description plus détaillée peut être trouvée ici .

  • La dépendance entre les variables aléatoires fait référence à tout type de relation entre les deux qui les amène à agir différemment «ensemble» qu’elles ne le font «seules». Plus précisément, la dépendance entre des variables aléatoires subsume toute relation entre les deux qui fait que leur distribution conjointe n'est pas le produit de leurs distributions marginales. Cela inclut les relations linéaires ainsi que de nombreuses autres.

  • Si deux variables sont liées de façon non linéaire , elles peuvent potentiellement avoir 0 covariance mais sont toujours dépendantes - de nombreux exemples sont donnés ici et ce graphique ci-dessous de wikipedia donne quelques exemples graphiques dans la rangée du bas:

    entrez la description de l'image ici

  • Un exemple où la covariance nulle et l'indépendance entre les variables aléatoires sont des conditions équivalentes est lorsque les variables sont distribuées normalement conjointement conjointement (c'est-à-dire que les deux variables suivent une distribution normale bivariée , ce qui n'est pas équivalent aux deux variables étant normalement distribuées individuellement). Un autre cas particulier est que les paires de variables bernoulli ne sont pas corrélées si et seulement si elles sont indépendantes (merci @cardinal). Mais, en général, les deux ne peuvent pas être considérés comme équivalents.

Par conséquent, on ne peut pas, en général, conclure que deux variables sont indépendantes simplement parce qu'elles semblent non corrélées (par exemple, n'a pas manqué de rejeter l'hypothèse nulle de non corrélation). On est bien avisé de tracer des données pour déduire si les deux sont liés, et pas seulement de s'arrêter à un test de corrélation. Par exemple, (merci @ gung), si l'on devait exécuter une régression linéaire (c'est-à-dire tester une corrélation non nulle) et trouver un résultat non significatif, on pourrait être tenté de conclure que les variables ne sont pas liées, mais vous '' ai seulement étudié une relation linéaire .

Je ne connais pas grand-chose à la psychologie, mais il est logique qu'il puisse y avoir des relations non linéaires entre les variables. À titre d'exemple de jouet, il semble possible que la capacité cognitive soit liée de manière non linéaire à l'âge - les très jeunes et les très vieux ne sont pas aussi tranchants que les 30 ans. Si l'on devait tracer une certaine mesure de l'aptitude cognitive par rapport à l'âge, on pourrait s'attendre à voir que la capacité cognitive est la plus élevée à un âge modéré et se dégrade autour de cela, ce qui serait un modèle non linéaire.


1
Juste un petit côté ( pédant?! ), Mais les variables aléatoires de Bernoulli sont indépendantes si et seulement si elles ne sont pas corrélées. :)
cardinal

@cardinal, ne vous inquiétez pas, c'est juste que j'abandonne à nouveau la rationalité, un peu comme quand vous avez dit qu'une normale multivariée avec une matrice de covariance singulière était "couramment utilisée et statistiquement pertinente".
Macro

La prochaine fois que je serai à Ann Arbor, je t'achèterai un café pour essayer de compenser cette plaisanterie. :) N'hésitez pas à remettre en question ma rationalité en attendant. :)
cardinal

Ah, mais cette dernière citation est vraie . ;-) Il apparaît dans certains endroits étonnamment communs. :) (Bien que cela devienne un peu hors sujet ici.)
Cardinal

(+1) J'ai été un peu sur la clôture pour savoir si cette question devrait être fermée en double ou non. Mais, je pense que de bonnes réponses peuvent faire que des questions très similaires méritent d'être conservées. Avoir tout réticulé aide.
cardinal

7

Une manière standard d'enseigner / visualiser une corrélation ou une covariance consiste à tracer les données, à tracer des lignes à la moyenne de 'x' et 'y', puis à tracer des rectangles du point des 2 moyennes aux points de données individuels, comme ceci:

entrez la description de l'image ici

Les rectangles (points) dans les quadrants supérieur droit et inférieur gauche (rouge dans l'exemple) contribuent à des valeurs positives pour la corrélation / covariance, tandis que les rectangles (points) dans les quadrants supérieur gauche et inférieur droit (bleu dans l'exemple) contribuent négativement valeurs à la corrélation / covariance. Si l'aire totale des rectangles rouges est égale à l'aire totale des rectangles bleus, les positifs et les négatifs s'annulent et vous obtenez une covariance nulle. S'il y a plus d'aire dans le rouge alors la covariance sera positive et s'il y a plus d'aire dans le bleu alors la covariance sera négative.

Voyons maintenant un exemple de la discussion précédente:

entrez la description de l'image ici

Les points individuels suivent une parabole, ils sont donc dépendants, si vous connaissez 'x' alors vous savez exactement 'y', mais vous pouvez également voir que pour chaque rectangle rouge il y a un rectangle bleu correspondant, donc la covariance finale sera 0 .


(+1) RExiste- t-il un package qui crée ces tracés (je me souviens avoir affiché un tracé comme celui-ci une fois) ou l'avez-vous fait à partir de zéro?
Macro

@Macro, bonne question, bien que je pense que ce soit fait dans Mathematica. Il est simple de le faire "à la main" dans R à l'aide de polygonou rectet d'un périphérique prenant en charge la transparence alpha.
cardinal

J'ai écrit une fonction pour faire ce complot et l'ajouterai probablement au TeachingDemospaquet très bientôt. Ma première pensée a été de raccourcir l'expression "rectangles de corrélation" pour "corriger" comme nom de la fonction, puis après un peu réalisé que le nom peut être facilement compris comme faisant quelque chose de tout à fait différent. Je dois donc trouver un meilleur nom, ajouter quelques options et le télécharger sur R-Forge.
Greg Snow

3

Un test simple si si les données suivent essentiellement un modèle symétrique autour d'un axe vertical ou horizontal passant par les moyennes, la co-variance sera assez proche de zéro. Par exemple, si la symétrie est autour de l'axe des y, cela signifie que pour chaque valeur avec un y donné, il y a une différence positive x de la moyenne x et une différence négative de la moyenne x. L'addition de y * x pour ces valeurs sera nulle. Vous pouvez le voir bien illustré dans la collection d'exemples de graphiques dans les autres réponses. Il existe d'autres modèles qui donneraient une co-variance nulle mais pas d'indépendance, mais de nombreux exemples sont facilement évalués en recherchant ou non la symétrie.


1

Un exemple de Wikipedia :

"Si les variables sont indépendantes, le coefficient de corrélation de Pearson est 0, mais l'inverse n'est pas vrai car le coefficient de corrélation ne détecte que les dépendances linéaires entre deux variables. Par exemple, supposons que la variable aléatoire X soit symétriquement distribuée autour de zéro, et Y = X ^ 2. Alors Y est complètement déterminé par X, de sorte que X et Y sont parfaitement dépendants, mais leur corrélation est nulle; ils ne sont pas corrélés. Cependant, dans le cas spécial où X et Y sont conjointement normaux, la non-corrélation équivaut à l'indépendance. "

En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.