Il y a une raison pour laquelle votre consultant en statistique n'a pas pu expliquer pourquoi l'introduction d'une interaction dans un modèle linéaire pourrait nuire à la structure de corrélation: cela dépend des circonstances et il n'est généralement pas vrai qu'il y ait un effet négatif. Regardez simplement les ensembles de données montrés dans les matrices de nuages de points ci-dessous pour voir toutes les différentes façons dont deux variables peuvent être liées à leurs produits.
Le reste de cet article explique comment ces chiffres ont été produits et pourraient donner un meilleur aperçu de la situation.
Commençons par l'évidence: écrire X3=X1X2, vous avez une régression multiple impliquant les trois variables X1,X2,X3. L’existence ou non de problèmes de colinéarité dépend des relations linéaires entre les Xje. C'est universel.
La particularité de ce problème est la relation entreX3 et l'autre Xje; à savoir que X3=X1X2. Ainsi, si quelqu'un vous a conseillé de faire attention, cela doit être dû à une attente que cette relation multiplicative entraîne mathématiquement une sorte de multicolinéarité entre tous lesXje.
Ce n'est tout simplement pas le cas, comme cela peut être démontré en présentant tous les modèles possibles. Je ne veux pas vous épuiser avec la pédanterie de passer par toutes les possibilités, alors laissez-moi juste esquisser quelques-unes des plus illustratives. L'outil de base que je vais utiliser dans cette étude est l'observation que la corrélation entre toutes les variablesX1,X2 reste inchangé lorsque le Xjesubissent séparément des transformations linéaires. Autrement dit, nous pouvons librement multiplier l'une ou l'autre variable par des constantes et ajouter d'autres constantes aux résultats sans modifier la corrélation. Cependant, ces opérations peuvent modifier profondément les corrélations entreX1X2 et Xje.
Produit (presque) constant
Il est possible pour X1X2être constant (ce qui, quand une régression comprend une constante, sera problématique). Pour créer un exemple, générez simplement des valeurs non nulles pourX1 et définir X2= c /X1. Leur produit est égal c par construction.
Vous pouvez perturber cet exemple en modifiant c ≠ 0 dans une variable aléatoire avec des valeurs proches de c . Faire cela introduira une petite corrélation entre le Xjeet leur produit, mais pas beaucoup. Voici, par exemple, un exemple oùX1 est tiré d'un Gamma( 5 ) distribution et c a une distribution normale avec une moyenne 1 et l'écart-type de seulement Une / 100 :
Bien que le Xje avoir une corrélation de ρ1 ⋅ 2= - 0,87 dans cet exemple, leurs corrélations avec X1X2 sont seulement - 0,06 et 0,00.
Par conséquent, bien qu'il puisse y avoir un peu de problème en utilisant les deux X1 et X2 dans un modèle linéaire, y compris X1X2 est peu susceptible de l'aggraver.
Produit non constant
Pour rendre les calculs plus clairs, nous pouvons aussi bien supposer que Xjeavoir une variance d'unité. Soit la variance deX1X2 être τ2 et écris ρ12 ⋅ i pour les corrélations entre X1X2 et Xje. Calculons ce qui arrive à ces corrélations lorsque les constantes cje sont soustraits de la Xje. Parce que le Xje jouer des rôles parfaitement symétriques (juste échanger "1" pour "2"dans les index), il suffit de calculer la corrélation avec X1:
Cor( (X1-c1) (X2-c2) ,X1)=Cov( (X1-c1) (X2-c2) ,X1)Var(X1-c1) (X2-c2) VarX1-----------------------√=Cov(X1X2-c2X1-c1X2+c1c2,X1)Var(X1X2-c1X2-c2X1+c1c2)-------------------------√=τρ12 ⋅ 1-c2-c1ρ1 ⋅ 2τ2-c1ρ1 ⋅ 2-c2- 2c1ρ12 ⋅ 2- 2c2ρ12 ⋅ 1+ 2c1c2ρ1 ⋅ 2-------------------------------------√.(*)
Aucune corrélation avec le produit
Quelle que soit la corrélation entre le Xjepourrait être, nous pouvons choisir(c1,c2) pour rendre le produit non corrélé avec le Xje.
D'après l'analyse qui précède, cet objectif sera atteint lorsque le numérateur de ( ∗ ) est nul pour i = 1 , 2 :
{0 = τρ12 ⋅ 1-c2-c1ρ1 ⋅ 20 = τρ12 ⋅ 2-c1-c2ρ1 ⋅ 2
Quand ρ21 ⋅ 2≠ 1 , ce système d'équations (c1,c2)a une solution unique. Voici, par exemple, une matrice de nuage de points d'un ensemble de données de100 valeurs dans lesquelles (Xje) avoir une distribution normale bivariée avec corrélation ρ1 ⋅ 2= - 0,99 mais le Xje avoir une corrélation nulle avec X1X2:
Parce que X1X2 est sans corrélation avec ("orthogonal à") à la fois le Xje, l'introduire dans n'importe quel modèle linéaire ne créera aucun problème.
Comme le suggère cet exemple, cette situation est la norme car elle a tendance à se produire lorsque le Xjeont été centrés. En d'autres termes, si vous centrez vos variables avant de créer une interaction, vous n'aurez généralement pas de problèmes avec une colinéarité supplémentaire.
De fortes corrélations avec le produit
Les équations ( ∗ )peut également être résolu pour produire de fortes corrélations. Nous n'avons même pas besoin d'aller jusqu'à résoudre les équations exactement (ce qui est difficile), car il existe un raccourci simple: en redimensionnant l'un desXjepour être proche de zéro et en y ajoutant une constante, nous ne changerons pas leur corrélation, mais alors le produit sera presque égal à un multiple de l'autre desXje, les rendant ainsi fortement corrélés.
Voici un exemple basé sur le précédent. Dans cet exemple,X2 a été changé en 1 +X2/ 100 pour que X1X2 est approximativement égal à X1, ce qui en fait fortement positivement corrélé avec X1X2. En effet, ρ12 ⋅ 1= 0,999878 et ρ12 ⋅ 2= - 0,9898793 dans cet exemple.