Peut-être qu'en simplifiant la notation, nous pouvons faire ressortir les idées essentielles. Il s'avère que nous n'avons pas besoin d'impliquer des attentes ou des formules compliquées, car tout est purement algébrique.
La nature algébrique des objets mathématiques
La question concerne les relations entre (1) la matrice de covariance d'un ensemble fini de variables aléatoires et (2) les relations linéaires entre ces variables, considérées comme des vecteurs .X1, … , Xn
L'espace vectoriel en question est l'ensemble de toutes les variables aléatoires à variance finie (sur tout espace de probabilité donné ) modulo le sous-espace de variables presque sûrement constantes, noté (Autrement dit, nous considérons deux variables aléatoires et comme étant le même vecteur lorsqu'il n'y a aucune chance que diffère de son attente.) Nous ne traitons que du vecteur de dimension finie l'espace généré par le ce qui en fait un problème algébrique plutôt qu'analytique.L 2 ( Ω , P ) / R . X Y X - Y V X i ,( Ω , P )L2( Ω , P ) / R .XOuiX- OuiVXje,
Ce que nous devons savoir sur les écarts
V est plus qu'un simple espace vectoriel: c'est un module quadratique, car il est équipé de la variance. Tout ce que nous devons savoir sur les écarts, ce sont deux choses:
La variance est une fonction scalaire avec la propriété que pour tous les vecteursQ ( a X ) = a 2 Q ( X ) X .QQ ( a X) = a2Q ( X)X.
La variance est non dégénérée.
Le second a besoin d'explications. détermine un «produit scalaire», qui est une forme bilinéaire symétrique donnée parQ
X⋅ Y= 14( Q ( X+ Y) - Q ( X- Oui) ) .
(Ce n'est bien sûr rien d'autre que la covariance des variables et ) Les vecteurs et sont orthogonaux lorsque leur produit scalaire est Le complément orthogonal de tout ensemble de vecteurs compose de tous les vecteurs orthogonaux à chaque élément de écritY . X Y 0. A ⊂ V A ,XOui.XOui0.UNE⊂ VUNE,
UNE0= { v ∈ V∣a.v=0 for all v∈V}.
Il s'agit clairement d'un espace vectoriel. Lorsque , est non dégénéré.QV0={0}Q
Permettez-moi de prouver que la variance est effectivement non dégénérée, même si cela peut sembler évident. Supposons que est un élément non nul de Cela signifie pour tous lesde manière équivalente,V 0 . X ⋅ Y = 0 Y ∈ V ;XV0.X⋅Y= 0Oui∈ V;
Q ( X+ Y) = Q ( X- Oui)
pour tous les vecteurs Prendre donneY = XOui.Oui= X
4Q(X)=Q(2X)=Q(X+X)=Q(X−X)=Q(0)=0
et donc Cependant, nous savons (en utilisant peut-être l'inégalité de Chebyshev) que les seules variables aléatoires avec une variance nulle sont presque sûrement constantes, ce qui les identifie avec le vecteur zéro dans QED.V ,Q(X)=0.V,
Interpréter les questions
Pour en revenir aux questions, dans la notation précédente, la matrice de covariance des variables aléatoires n'est qu'un tableau régulier de tous leurs produits scalaires,
T=(Xi⋅Xj).
Il y a une bonne façon de penser à : il définit une transformation linéaire sur de la manière habituelle, en envoyant n'importe quel vecteur dans le vecteur dont la composante est donnée par la règle de multiplication matricielleR n x = ( x 1 , … , x n ) ∈ R n T ( x ) = y = ( y 1 , … , x n ) i thTRnx=(x1,…,xn)∈RnT(x)=y=(y1,…,xn)ith
yi=∑j=1n(Xi⋅Xj)xj.
Le noyau de cette transformation linéaire est le sous-espace qu'il envoie à zéro:
Ker(T)={x∈Rn∣T(x)=0}.
L'équation précédente implique que lorsque pour chaqueix∈Ker(T),i
0=yi=∑j=1n(Xi⋅Xj)xj=Xi⋅(∑jxjXj).
Comme cela est vrai pour chaque il en va de même pour tous les vecteurs couverts par le : à savoir, lui-même. Par conséquent, lorsque le vecteur donné par se trouve dans Parce que la variance n'est pas dégénérée, cela signifie Autrement dit, décrit une dépendance linéaire entre les variables aléatoires d'origine.X i V x ∈ Ker ( T ) , ∑ j x j X j V 0 . ∑ j x j X j = 0. x ni,XiVx∈Ker(T),∑jxjXjV0.∑jxjXj=0.xn
Vous pouvez facilement vérifier que cette chaîne de raisonnement est réversible:
Les dépendances linéaires entre les tant que vecteurs sont en correspondance biunivoque avec les éléments du noyau de T .Xj T.
(Rappelez-vous, cette instruction considère toujours le comme défini jusqu'à un décalage constant de l'emplacement - c'est-à-dire comme des éléments de plutôt que comme juste des variables aléatoires.)L 2 ( Ω , P ) / RXjL2(Ω,P)/R
Enfin, par définition, une valeur propre de est tout scalaire pour lequel il existe un vecteur non nul avec Lorsque est une valeur propre, l'espace des vecteurs propres associés est (évidemment) le noyau deλ x T ( x ) = λ x . λ = 0 T .TλxT(x)=λx.λ=0T.
Résumé
Nous sommes arrivés à la réponse aux questions: l'ensemble des dépendances linéaires des variables aléatoires, qua éléments de correspond un à un avec le noyau de leur matrice de covariance Il en est ainsi parce que la variance est une forme quadratique non dégénérée. Le noyau est également l'espace propre associé à la valeur propre nulle (ou simplement le sous-espace zéro lorsqu'il n'y a pas de valeur propre nulle).T.L2(Ω,P)/R,T.
Référence
J'ai largement adopté la notation et une partie du langage du chapitre IV dans
Jean-Pierre Serre, un cours d'arithmétique. Springer-Verlag 1973.