Les variables aléatoires et dépendantes?


15

Peut-on dire quelque chose sur la dépendance d'une variable aléatoire et d'une fonction d'une variable aléatoire? Par exemple, dépend-il de ?X2X2XX


5
Si XX et f ( X )f(X) sont indépendants, alors f ( X )f(X) est constant presque sûrement. Autrement dit, il existe una tel que P ( f ( X ) = a ) = 1P(f(X)=a)=1 .
cardinal du

2
@cardinal -pourquoi ne pas en faire une réponse ?
Karl

@cardinal, je voulais demander à John de développer son commentaire. Je tenais pour acquis que la fonction considérée était une fonction déterministe donnée. Dans le processus, j'ai fini par écrire un argument pour le résultat que vous avez déclaré à la place. Tous les commentaires sont les bienvenus et appréciés.
NRH

Oui, X 2X2 dépend de XX , car si vous connaissez X,X vous connaissez X 2X2 . XX et YY sont indépendants si la connaissance de la valeur XX n'a pas d' incidence sur vos connaissances de la distribution de YY .
Henry

2
@iamrohitbanga: Si X { - 1 , 1 }X{1,1} alors X 2 = 1X2=1 presque sûrement. Donc, XX est indépendant de X 2X2 dans ce cas très particulier.
Cardinal

Réponses:


18

Voici une preuve du commentaire de @ cardinal avec une petite torsion. Si XX et f ( X )f(X) sont indépendants alors P ( X A f - 1 ( B ) ) = P ( X A , f ( X ) B )= P ( X A ) P ( f ( X ) B )= P ( X A ) P ( X f - 1 ( B ) )

P(XAf1(B))===P(XA,f(X)B)P(XA)P(f(X)B)P(XA)P(Xf1(B))
PrendreA=f-1(B)A=f1(B)donne l'équation P(f(X)B)=P(f(X)B)2,
P(f(X)B)=P(f(X)B)2,
qui a les deux solutions 0 et 1. AinsiP(f(X)B ) { 0 , 1 }P(f(X)B){0,1} pour tous BB . En général, il n'est pas possible d'en dire plus. Si XX et f ( X )f(X) sont indépendants, alors f ( X )f(X) est une variable telle que pour tout B,B il est soit en BB soit en B cBc avec la probabilité 1. Pour en dire plus, il faut plus d'hypothèses, par exemple que singleton fixe { b }{b} sont mesurables.

Cependant, les détails au niveau théorique de la mesure ne semblent pas être la principale préoccupation du PO. Si X est réel et f est une fonction réelle (et nous utilisons l' algèbre Borel σ , disons), alors en prenant B = ( - , b ], il s'ensuit que la fonction de distribution pour la distribution de f ( X ) ne prend que la valeurs 0 et 1, donc il y a un b auquel il passe de 0 à 1 et P ( f ( X ) = b ) = 1XfσB=(,b]f(X)b01P(f(X)=b)=1.

En fin de compte, la réponse à la question des PO est que X et f ( X ) sont généralement dépendants et indépendants uniquement dans des circonstances très particulières. De plus, la mesure de Dirac δ f ( x ) se qualifie toujours pour une distribution conditionnelle de f ( X ) donnée X = x , ce qui est une façon formelle de dire que connaissant X = x alors vous savez aussi exactement ce que f ( X )Xf(X)δf(x)f(X)X=xX=xf(X)est. Cette forme spéciale de dépendance à distribution conditionnelle dégénérée est caractéristique des fonctions de variables aléatoires.


(+1) Désolé. Pendant que je composais ma réponse, je n'ai pas reçu de mise à jour que vous en aviez soumise également. :)
Cardinal

21

Lemme : Soit X une variable aléatoire et f une fonction (mesurable Borel) telle que X et f ( X ) sont indépendants. Alors f ( X ) est constant presque sûrement. Autrement dit, il y a un certain un R tel que P ( f ( X ) = a ) = 1 .XfXf(X)f(X)aRP(f(X)=a)=1

La preuve est ci-dessous; mais, d'abord, quelques remarques. La mesurabilité Borel n'est qu'une condition technique pour garantir que nous pouvons attribuer des probabilités de manière raisonnable et cohérente. La déclaration "presque sûrement" n'est aussi qu'une technicité.

L'essence du lemme est que si nous voulons que X et f ( X ) soient indépendants, alors nos seuls candidats sont des fonctions de la forme f ( x ) = a .Xf(X)f(x)=a

Comparez cela au cas des fonctions f telles que X et f ( X ) ne sont pas corrélées . C'est une condition beaucoup, beaucoup plus faible. En effet, considérons toute variable aléatoire X avec un zéro moyen, un troisième moment absolu fini et symétrique par rapport à zéro. Prenez f ( x ) = x 2 , comme dans l'exemple de la question. Alors C o v ( X , f ( X ) ) = E X f (fXf(X)Xf(x)=x2X ) = E X 3 = 0 , donc X et f ( X ) = X 2 ne sont pas corrélés.Cov(X,f(X))=EXf(X)=EX3=0Xf(X)=X2

Ci-dessous, je donne la preuve la plus simple que j'ai pu trouver pour le lemme. Je l' ai fait très bavard pour que tous les détails sont aussi évidentes que possible. Si quelqu'un voit des moyens de l'améliorer ou de le simplifier, j'aimerais le savoir.

Idée de preuve : Intuitivement, si nous connaissons X , alors nous connaissons f ( X ) . Nous devons donc trouver un événement dans σ ( X ) , l'algèbre sigma générée par X , qui relie notre connaissance de X à celle de f ( X ) . Ensuite, nous utilisons ces informations conjointement avec l'indépendance supposée de X et f ( X ) pour montrer que nos choix disponibles pour f ont été sévèrement limités.Xf(X)σ(X)XXf(X)Xf(X)f

Proof of lemma: Recall that XX and YY are independent if and only if for all Aσ(X)Aσ(X) and Bσ(Y)Bσ(Y), P(XA,YB)=P(XA)P(YB)P(XA,YB)=P(XA)P(YB). Let Y=f(X)Y=f(X) for some Borel measurable function ff such that XX and YY are independent. Define A(y)={ω:f(X(ω))y}A(y)={ω:f(X(ω))y}. Then, A(y)={ω:X(ω)f1((,y])}

A(y)={ω:X(ω)f1((,y])}
and since (,y](,y] is a Borel set and ff is Borel-measurable, then f1((,y])f1((,y]) is also a Borel set. This implies that A(y)σ(X)A(y)σ(X) (by definition(!) of σ(X)σ(X)).

Since XX and YY are assumed independent and A(y)σ(X)A(y)σ(X), then P(XA(y),Yy)=P(XA(y))P(Yy)=P(f(X)y)P(f(X)y),

P(XA(y),Yy)=P(XA(y))P(Yy)=P(f(X)y)P(f(X)y),
and this holds for all yRyR. But, by definition of A(y)A(y) P(XA(y),Yy)=P(f(X)y,Yy)=P(f(X)y).
P(XA(y),Yy)=P(f(X)y,Yy)=P(f(X)y).
Combining these last two, we get that for every yRyR, P(f(X)y)=P(f(X)y)P(f(X)y),
P(f(X)y)=P(f(X)y)P(f(X)y),
so P(f(X)y)=0P(f(X)y)=0 or P(f(X)y)=1P(f(X)y)=1. This means there must be some constant aRaR such that the distribution function of f(X)f(X) jumps from zero to one at aa. In other words, f(X)=af(X)=a almost surely.

NB: Note that the converse is also true by an even simpler argument. That is, if f(X)=af(X)=a almost surely, then XX and f(X)f(X) are independent.


+1, I should be sorry - to steal your argument is not very polite. It's great that you spelled out the difference between independence and being uncorrelated in this context.
NRH

No "stealing" involved, nor impoliteness. :) Though many of the ideas and comments are similar (as you'd expect for a question like this!), I think the two posts are nicely complementary. In particular, I like how at the beginning of your post you didn't constrain yourself to real-valued random variables.
cardinal

@NRH accepting your answer as the initial part of your proof seems easier to grasp for a novice like me. Nevertheless +1 cardinal for your answer.
Rohit Banga
En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.