Chaque matrice de corrélation positive est-elle définie?

11

Je parle ici de matrices de corrélations de Pearson.

J'ai souvent entendu dire que toutes les matrices de corrélation doivent être semi-définies positives. Ma compréhension est que les matrices définies positives doivent avoir des valeurs propres , tandis que les matrices semi-définies positives doivent avoir des valeurs propres . Cela me fait penser que ma question peut être reformulée comme "Est-il possible que les matrices de corrélation aient une valeur propre ?" $> 0$ $\ge 0$ $= 0$

Est-il possible qu'une matrice de corrélation (générée à partir de données empiriques, sans données manquantes) ait une valeur propre ou une valeur propre ? Et si c'était plutôt une matrice de corrélation de population? $= 0$ $< 0$

Je lis à la réponse de haut à cette question sur les matrices de covariance qui

Considérons trois variables , et . Leur matrice de covariance, , n'est pas définie positive, car il existe un vecteur ( ) pour lequel n'est pas positif. $X$ $Y$ $Z = X+Y$ $M$ $z$ $= (1, 1, -1)'$ $z'Mz$

Cependant, si au lieu d'une matrice de covariance je fais ces calculs sur une matrice de corrélation, alors apparaît comme positif. Je pense donc que la situation est peut-être différente pour les matrices de corrélation et de covariance. $z'Mz$

Ma raison de demander est que l'on m'a demandé sur stackoverflow , par rapport à une question que j'ai posée là-bas.

covariance-matrix eigenvalues correlation-matrix

— user1205901 - Réintégrer Monica
source

Si, par exemple, deux attributs sont une seule chose, ayant seulement des noms différents, la matrice est singulière. Si deux attributs s'ajoutent à une constante, elle est à nouveau singulière, et cetera .

— ttnphns

Si une matrice de covariance est singulière, la matrice de corrélation est également singulière.

— ttnphns

2

Presque doublons: chaque matrice de corrélation est-elle semi-définie positive? qui se concentre moins sur l'angle défini par rapport à l'angle semi-défini, et chaque matrice de covariance est-elle définie positive? ce qui est pertinent car une covariance est essentiellement une corrélation redimensionnée.

— Silverfish

16

Les matrices de corrélation n'ont pas besoin d'être définies positives.

Considérons une variable aléatoire scalaire X ayant une variance non nulle. Alors la matrice de corrélation de X avec elle-même est la matrice de tous, qui est semi-définie positive, mais pas définie positive.

En ce qui concerne la corrélation d'échantillon, considérons les données d'échantillon pour ce qui précède, ayant la première observation 1 et 1, et la deuxième observation 2 et 2. Il en résulte que la corrélation d'échantillon est la matrice de tous, donc pas définie positive.

Un échantillon de matrice de corrélation, s'il est calculé en arithmétique exacte (c'est-à-dire sans erreur d'arrondi) ne peut pas avoir de valeurs propres négatives.

— Mark L. Stone
source

4

Il peut être utile de mentionner les effets possibles des valeurs manquantes sur la matrice de corrélation de l'échantillon . Le fuzz numérique n'est pas la seule raison d'obtenir une valeur propre négative dans une matrice de corrélation / covariance d'échantillon.

— Silverfish

1

Oui, je ne l'ai pas rendu explicite, mais je supposais, selon l'énoncé de la question, "sans données manquantes". Une fois que vous entrez dans le monde sauvage et loufoque des données manquantes et de leurs ajustements, tout se passe.

— Mark L. Stone

Oui, désolé, vous avez tout à fait raison, la question disait "pas de données manquantes" - pensais juste que cela valait la peine d'être mentionné quelque part car les futurs chercheurs pourraient être intéressés même si l'appétit du PO était satisfait!

— Silverfish

7

Les réponses de @yoki et @MarkLStone (+1 aux deux) indiquent toutes les deux qu'une matrice de corrélation de population peut avoir zéro valeurs propres si les variables sont liées linéairement (comme par exemple dans l'exemple de @MarkLStone et dans l'exemple de @yoki). $X_1 = X_2$ $X_1 = 2X_2$

De plus, une matrice de corrélation d' échantillon aura nécessairement des valeurs propres nulles si , c'est-à-dire si la taille de l'échantillon est inférieure au nombre de variables. Dans ce cas, les matrices de covariance et de corrélation seront toutes deux au plus de rang , il y aura donc au moins valeurs propres nulles. Voir Pourquoi une matrice de covariance d'échantillon est-elle singulière lorsque la taille de l'échantillon est inférieure au nombre de variables? et Pourquoi le rang de la matrice de covariance est-il au plus ? $n<p$ $n-1$ $p-n+1$ $n-1$

— amibe
source

Vrai 'dat. Je suppose que j'aurais pu et aurais dû fournir cette information également, mais mon objectif était de produire un contre-exemple pour réfuter l'hypothèse du PO, montrant ainsi son invalidité. sera au plus de rang n-1, donc il y aura au moins (p-n + 1) zéro valeur propre. "

— Mark L. Stone

4

Considérons comme un rv avec une moyenne de 0 et une variance de 1. Soit , et calculons la matrice de covariance de . Puisque , et $X$ $Y=2X$ $(X,Y)$ $2X=Y$ $E[Y^2]=4E[X^2]=\sigma_Y^2$ $E[XY]=2E[X^2]$ . En raison de la configuration moyenne nulle, les seconds moments sont égaux aux covariances appropriées, par exemple: . $\mbox{Cov}(X,Y)=E[XY]-EXEY=E[XY]$

La matrice de covariance sera donc: ayant une valeur propre nulle. La matrice de corrélation sera: ayant également une valeur propre nulle. En raison de la correspondance linéaire entre et il est facile de comprendre pourquoi nous obtenons cette matrice de corrélation - la diagonale sera toujours 1 et la hors diagonale est 1 en raison de la relation linéaire.

Λ = (\begin{matrix} 1 & 2 \\ 2 & 4 \end{matrix}),

$\Lambda = \left(\array{1 & 2 \\ 2 & 4 }\right),$

Λ = (\begin{matrix} 1 & 1 \\ 1 & 1 \end{matrix}),

$\Lambda = \left(\array{1 & 1 \\ 1 & 1 }\right),$

X

$X$

Y

$Y$

— yoki
source

2

Λ

$\Lambda$

c o v (X, Y) = E (X Y) - E (X) E (Y) = 2 E [X^{2}] = 2 (σ_{X}^{2} + [E (X)]^{2})

$cov(X,Y)= \mathbb{E}(XY)-\mathbb{E}(X)\mathbb{E}(Y)= 2\mathbb{E}[X^2]=2\left(\sigma_X^2+[E(X)]^2\right)$

E (X^{2}) = Var (X) + [E (X)]^{2}

$E(X^2)=\text{Var}(X)+[E(X)]^2$

d i a g Λ^{- 1 / 2} Λ d i a g Λ^{1 / 2}

$diag \Lambda^{-1/2}\,\Lambda\, diag \Lambda^{1/2}$

@AntoniParellada, je ne sais pas exactement ce que vous voulez dire - la covariance ici est un calcul direct. Mais je vais éditer et clarifier cela. Merci.

— yoki