Il existe trois variables aléatoires, . Les trois corrélations entre les trois variables sont les mêmes. C'est,
Quelle est la limite la plus stricte que vous pouvez donner pour ?
Il existe trois variables aléatoires, . Les trois corrélations entre les trois variables sont les mêmes. C'est,
Quelle est la limite la plus stricte que vous pouvez donner pour ?
Réponses:
La corrélation commune peut avoir la valeur mais pas . Si , alors ne peut pas être égal à mais est en fait . La plus petite valeur de la corrélation commune de trois variables aléatoires est . Plus généralement, la corrélation commune minimale de variables aléatoires est lorsque, considérées comme vecteurs, elles se trouvent aux sommets d'un simplexe (de dimension ) dans un espace à dimensions.+ 1 - 1 ρ X , Y = ρ X , Z = - 1 ρ Y , Z - 1 + 1 - 1 n-1 n-1n
Considérons la variance de la somme de variables aléatoires de variance unitaire . Nous avons cela où est la moyenne valeur des coefficients de corrélation . Mais depuis , nous obtenons facilement de ce X i var ( n ∑ i = 1 X i ) ˉ ρ
Ainsi, la valeur moyenne d'un coefficient de corrélation est au moins . Si tous les coefficients de corrélation ont la même valeur , alors leur moyenne est également égale à et nous avons donc cela Est-il possible d'avoir des variables aléatoires pour lesquelles la valeur de corrélation commune est égale à ? Oui. Supposons que les sont des variables aléatoires de variance unitaire non corrélées et définissons . Alors, , tandis que
La limite la plus étroite possible est . Toutes ces valeurs peuvent réellement apparaître - aucune n'est impossible.
Pour montrer qu'il n'y a rien de particulièrement profond ou de mystérieux dans le résultat, cette réponse présente d'abord une solution complètement élémentaire, ne nécessitant que le fait évident que les variances - étant les valeurs attendues des carrés - doivent être non négatives. Vient ensuite une solution générale (qui utilise des faits algébriques légèrement plus sophistiqués).
La variance de toute combinaison linéaire de doit être non négative. Soit les variances de ces variables respectivement et . Tous sont différents de zéro (sinon, certaines corrélations ne seraient pas définies). En utilisant les propriétés de base des variances, nous pouvons calculer
pour tous les nombres réels .
En supposant , une petite manipulation algébrique implique que cela équivaut à
Le terme carré sur le côté droit est le rapport de deux moyennes de puissance de . L' inégalité élémentaire moyenne de puissance (avec des poids ) affirme que le rapport ne peut pas dépasser (et sera égal à lorsque ). Un peu plus d'algèbre implique alors
L'exemple explicite de ci-dessous (impliquant des variables normales trivariées ) montre que toutes ces valeurs, , surviennent en fait sous forme de corrélations. Cet exemple utilise uniquement la définition de normales multivariées, mais n'invoque autrement aucun résultat de calcul ou d'algèbre linéaire.
Toute matrice de corrélation est la matrice de covariance des variables aléatoires standardisées, d'où - comme toutes les matrices de corrélation - elle doit être semi-définie positive. De manière équivalente, ses valeurs propres sont non négatives. Cela impose une condition simple à : elle ne doit pas être inférieure à (et bien sûr ne peut pas dépasser ). Inversement, un tel correspond en fait à la matrice de corrélation d'une distribution trivariée, prouvant que ces bornes sont les plus serrées possibles.
Considérons la matrice de corrélation par avec toutes les valeurs hors diagonale égales à(La question concerne le cas mais cette généralisation n'est pas plus difficile à analyser.) Appelons-la Par définition, est une valeur propre de à condition qu'il existe un vecteur non nul tel que
Ces valeurs propres sont faciles à trouver dans le cas présent, car
Laisser , calculer que
Laisser avec un uniquement à la place (pour ), calculer que
Parce que les vecteurs propres trouvés jusqu'à présent couvrent tout l' espace dimensionnel (preuve: une réduction de ligne facile montre la valeur absolue de leur déterminant égal à , qui est non nul), ils constituent une base de tous les vecteurs propres. Nous avons donc trouvé toutes les valeurs propres et déterminé qu'elles sont soit ou (ce dernier avec la multiplicité ). En plus de l'inégalité bien connue satisfaite par toutes les corrélations, la non-négativité de la première valeur propre implique en outre
tandis que la non-négativité de la deuxième valeur propre n'impose pas de nouvelles conditions.
Les implications fonctionnent dans les deux sens: à condition que la matrice soit définie de façon non négative et soit donc une matrice de corrélation valide. C'est, par exemple, la matrice de corrélation pour une distribution multinormale. Plus précisément, écrivez
pour l'inverse de lorsque Par exemple, lorsque
Laissons le vecteur de variables aléatoires avoir une fonction de distribution
où . Par exemple, lorsque cela équivaut à
La matrice de corrélation pour ces variables aléatoires est
Contours des fonctions de densité De gauche à droite, . Notez comment la densité passe d'une concentration près du plan à une concentration près de la ligne .
Les cas particuliers et peuvent également être réalisés par des distributions dégénérées ; Je n'entrerai pas dans les détails, sauf pour souligner que dans le premier cas, la distribution peut être considérée comme prise en charge sur l'hyperplan , où il s'agit d'une somme de moyennes réparties de manière identique - Distribution normale , alors que dans ce dernier cas (corrélation positive parfaite), elle est supportée sur la ligne générée par , où elle a une distribution moyenne normale.
Un examen de cette analyse montre clairement que la matrice de corrélation a un rang et a un rang de (car un seul vecteur propre a une valeur propre non nulle). Pour , cela fait dégénérer la matrice de corrélation dans les deux cas. Sinon, l'existence de son inverse prouve qu'il n'est pas dégénéré.
Votre matrice de corrélation est
La matrice est semi-définie positive si les principaux mineurs principaux ne sont pas tous négatifs. Les principaux mineurs sont les déterminants des blocs "nord-ouest" de la matrice, soit 1, le déterminant de
et le déterminant de la matrice de corrélation elle-même.
1 est évidemment positif, le second mineur principal est , ce qui n'est pas négatif pour toute corrélation admissible . Le déterminant de la matrice de corrélation entière est
Le graphique montre le déterminant de la fonction sur la plage des corrélations admissibles .
Vous voyez que la fonction est non négative sur la plage donnée par @stochazesthai (que vous pouvez également vérifier en trouvant les racines de l'équation déterminante).
Il existe des variables aléatoires , et avec des corrélations par paires si et seulement si la matrice de corrélation est semi-définie positive. Cela se produit uniquement pour .