Exemples simples de et non corrélés mais non indépendants


26

Tout étudiant qui travaille dur est un contre-exemple de "tous les étudiants sont paresseux".

Quels sont les contre-exemples simples pour "si les variables aléatoires et sont pas corrélées, alors elles sont indépendantes"?XOui


8
Je pense que c'est un doublon, mais je suis trop paresseux pour le rechercher. Prenez et Y = X ^ 2 . cov (X, Y) = EX ^ 3 = 0 , mais il est clair que les deux variables ne sont pas indépendantes. XN(0,1)Oui=X2cov(X,Oui)=EX3=0
mpiktas

1
un exemple simple (bien qu'il y en ait peut-être encore plus simples)
Glen_b -Reinstate Monica

1
Prendre U soit uniformément distribué sur [0,2π] et X=cosU , Oui=péchéU .
Dilip Sarwate

Parce que le sens du "plus simple" n'est pas défini, cette question n'est pas objectivement répondable. J'ai choisi le doublon sur stats.stackexchange.com/questions/41317 sur la base de la plus simple = plus petite somme des cardinalités des supports des distributions marginales.
whuber

3
@whuber: Même si "le plus simple" n'est en effet pas très bien défini, les réponses ici, par exemple la réponse de Glen_b fournissent clairement un exemple beaucoup plus simple que le fil dont vous avez fermé celui-ci en double. Je suggère de rouvrir celui-ci (j'ai déjà voté) et peut-être de faire en sorte que CW souligne le fait que "le plus simple" est mal défini et OP demande peut-être divers exemples "simples".
amibe dit Réintégrer Monica

Réponses:


18

Soit XU(-1,1) .

Soit .Oui=X2

Les variables ne sont pas corrélées mais dépendent.

Alternativement, considérons une distribution bivariée discrète composée d'une probabilité à 3 points (-1,1), (0, -1), (1,1) avec une probabilité de 1/4, 1/2, 1/4 respectivement. Les variables sont alors non corrélées mais dépendantes.

Considérons des données bivariées uniformes dans un diamant (un carré pivoté à 45 degrés). Les variables seront non corrélées mais dépendantes.

Ce sont les cas les plus simples auxquels je puisse penser.


Toutes les variables aléatoires symétriques et centrées autour de 0 sont-elles non corrélées?
Martin Thoma

1
@moose Votre description est ambiguë. Si vous voulez dire "si est symétrique par rapport à zéro et est symétrique par rapport à zéro", alors non, car une normale bivariée avec des marges normales standard peut être corrélée, par exemple. Si vous voulez dire "si est symétrique par rapport à zéro et est une fonction paire de ", alors tant que les variances existent, je crois que la réponse est oui. Si vous voulez dire autre chose, vous devrez l'expliquer. Y X Y XXOuiXOuiX
Glen_b -Reinstate Monica

7

Je pense que l'essence de certains des contre-exemples simples peut être vue en commençant par une variable aléatoire continue centrée sur zéro, c'est-à-dire . Supposons que le pdf de soit pair et défini sur un intervalle de la forme , où . Supposons maintenant pour une fonction . Nous posons maintenant la question: pour quel type de fonctions pouvons-nous avoir ?E [ X ] = 0 X ( - a , a ) a > 0 Y = f ( X ) f f ( X ) C o v ( X , f ( X ) ) = 0XE[X]=0X(-une,une)une>0Oui=F(X)FF(X)Cov(X,F(X))=0

Nous savons que . Notre hypothèse selon laquelle nous conduit directement à . En désignant le pdf de via , nous avonsE [ X ] = 0 C o v ( X , f ( X ) ) = E [ X f ( X ) ] X p (Cov(X,F(X))=E[XF(X)]-E[X]E[F(X)]E[X]=0Cov(X,F(X))=E[XF(X)]Xp()

Cov(X,F(X))=E[XF(X)]=-uneuneXF(X)p(X)X .

Nous voulons et une façon d'y parvenir est de s'assurer que est une fonction paire, ce qui implique que est une fonction impaire. Il s'ensuit alors que , et donc .f ( x ) x f ( x ) p ( x ) a - a x f ( x ) p ( x ) d x = 0 C o v ( X , f ( X ) ) = 0Cov(X,F(X))=0F(X)XF(X)p(X)-uneuneXF(X)p(X)X=0Cov(X,F(X))=0

De cette façon, nous pouvons voir que la répartition précise de est sans importance que le long que le pdf est symétrique autour de un point et une fonction même va faire pour définir .f ( ) YXF()Oui

Espérons que cela puisse aider les élèves à voir comment les gens parviennent à ces types de contre-exemples.


5

Soyez le contre-exemple (ie étudiant travailleur)! Ceci étant dit:

J'essayais de penser à un exemple du monde réel et ce fut le premier qui m'est venu à l'esprit. Ce ne sera pas le cas mathématiquement le plus simple (mais si vous comprenez cet exemple, vous devriez pouvoir trouver un exemple plus simple avec des urnes et des balles ou quelque chose).

Selon certaines recherches, le QI moyen des hommes et des femmes est le même, mais la variance du QI masculin est supérieure à la variance du QI féminin. Pour être concret, disons que le QI masculin suit et le QI féminin suit avec . La moitié de la population est masculine et la moitié de la population féminine.N ( 100 , α σ 2 ) α < 1N(100,σ2)N(100,ασ2)α<1

En supposant que cette recherche est correcte:

Quelle est la corrélation entre le sexe et le QI?

Le sexe et le QI sont-ils indépendants?


4

On peut définir une variable aléatoire discrète avecP ( X = - 1 ) = P ( X = 0 ) = P ( X = 1 ) = 1X{-1,0,1}P(X=-1)=P(X=0)=P(X=1)=13

puis définissezOui={1,siX=00,autrement

Il peut être facilement vérifié que et sont pas corrélés mais pas indépendants.YXOui


2

Essayez ceci (code R):

x=c(1,0,-1,0);  
y=c(0,1,0,-1);  

cor(x,y);  
[1] 0

C'est à partir de l'équation du cercleX2+y2-r2=0

xOui n'est pas corrélé avec , mais il est fonctionnellement dépendant (déterministe). X


1
L'échantillon de corrélation zéro ne signifie pas que la vraie corrélation est nulle.
mpiktas

3
@mpiktas Si ces quatre valeurs représentent une distribution bivariée avec chacune une probabilité 1/4, la corfonction renvoyant zéro indiquera une corrélation de population de zéro.
Glen_b -Reinstate Monica

@Glen_b J'aurais dû faire de meilleurs commentaires sur le code. Cela pourrait ne pas être connu de tous. Vous pouvez utiliser des points-virgules, je pense que ce n'est pas recommandé comme style de codage dans R.
Analyst

1
@Glen_b oui vous avez raison. Mais cela n'a pas été déclaré. Belle observation btw.
mpiktas

1

Le seul cas général où l'absence de corrélation implique l'indépendance est lorsque la distribution conjointe de X et Y est gaussienne.


2
Cela ne répond pas directement à la question en produisant un exemple simple - en ce sens, il s'agit plutôt d'un commentaire - mais il fournit une réponse indirecte, en ce qu'il suggère un ensemble très large d'exemples possibles. Il pourrait être utile de reformuler ce message pour clarifier comment il répond à la question d'origine.
Silverfish

-1

Une réponse en deux phrases: le cas le plus clair de dépendance statistique non corrélée est une fonction non linéaire d'un RV, disons Y = X ^ n. Les deux VR sont clairement dépendants mais pas encore corrélés, car la corrélation est une relation linéaire.


XXOui=Xn

Cette réponse est incorrecte. Dans R: Expression: {x <- runif (100); cor (x, x ^ 3)} Résultat: 0.9062057
Josh
En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.