Deux effets principaux négatifs mais un effet d'interaction positif?

17

J'ai deux effets principaux, V1 et V2. Les effets de V1 et V2 sur les variables de réponse sont négatifs. Cependant, pour une raison quelconque, j'obtiens un coefficient positif pour le terme d'interaction V1 * V2. Comment puis-je interpréter cela? une telle situation est-elle possible?

regression interaction

— Jin-Dominique
source

3

Absolument. Il peut être interprété comme une réduction de l'effet estimé inverse de V1 à travers les niveaux de V2 (ou vice versa), c'est-à-dire que l'effet inverse de V1 n'est pas aussi inverse pour des observations plus élevées de V2. Vous devez tout tracer pour vérifier.

— DL Dahly

Les principaux coefficients d'effet sont la pente de la surface de réponse dans les directions V1 et V2 au point V1 = V2 = 0. Si votre modèle contient une interception, essayez de centrer V1 et V2 (c'est-à-dire, soustrayez leurs moyennes). L'interaction est le produit des V1 et V2 centrés; il n'est pas centré séparément et son coefficient ne devrait pas changer.

— Ray Koopman

Je crois que le vôtre est un problème légèrement différent, mais vous pouvez trouver le paradoxe de Simpson intéressant: en.wikipedia.org/wiki/Simpson's_paradox

— David Marx

28

Certainement. À titre d'exemple simple, envisagez une expérience dans laquelle vous ajoutez certains volumes d'eau chaude (V1) et froide (V2) à un aquarium qui commence à la bonne température. La variable de réponse (V3) est le nombre de poissons qui survivent après une journée. Intuitivement, si vous ajoutez uniquement de l'eau chaude (V1 augmente), beaucoup de poissons mourront (V3 descendra). Si vous ajoutez seulement de l'eau froide (V2 augmente), beaucoup de poissons mourront (V3 descendra). Mais si vous ajoutez de l'eau chaude et froide (V1 et V2 augmentent, donc V1 * V2 augmente), le poisson ira bien (V3 reste élevé), donc l'interaction doit contrer les deux effets principaux et être positive.

Ci-dessous, j'ai constitué 18 points de données imitant la situation ci-dessus et ajusté la régression linéaire multiple dans R et inclus la sortie. Vous pouvez voir les deux effets principaux négatifs et l'interaction positive dans la dernière ligne. Vous pouvez laisser V1 = Litres d'eau chaude, V2 = Litres d'eau froide et V3 = Nombre de poissons vivants après une journée.

   V1 V2  V3
1   0  0 100
2   0  1  90
3   1  0  89
4   1  1  99
5   2  0  79
6   0  2  80
7   2  1  91
8   1  2  92
9   2  2  99
10  3  3 100
11  2  3  88
12  3  2  91
13  0  3  70
14  3  0  69
15  3  3 100
16  4  0  61
17  0  4  60
18  4  2  82

A = matrix(c(0,0,100, 0,1,90, 1,0,89, 1,1,99, 2,0,79, 0,2,80, 2,1,91, 1,2,92, 
2,2,99, 3,3,100, 2,3,88, 3,2,91, 0,3,70, 3,0,69, 3,3,100, 4,0,61, 0,4,60, 
4,2, 82), byrow=T, ncol=3)

A = as.data.frame(A)

summary(lm(V3~V1+V2+V1:V2, data=A))


Coefficients:
(Intercept)           V1           V2        V1:V2  
    103.568      -10.853      -10.214        6.563

— Underminer
source

8

Exemple intelligent.

— DL Dahly

5

Une autre façon de voir la situation par rapport au brillant exemple de @ miner est de noter que sous la régression des moindres carrés, vos valeurs ajustées satisfont aux «contraintes de corrélation»

\sum_{je = 1}^{n} X_{je k} {\hat{y}}_{je} = \sum_{je = 1}^{n} X_{je k} y_{je}

$\sum_{ i=1}^nx_{ik}\hat{y}_i=\sum_{ i=1}^nx_{ik}y_i$

$x_{ik}$

$V1$

β_{1} + V 2 β_{1 * 2}

$\beta_1 + V2\beta_{1*2}$

$\beta_1$ $V1$

— probabilitéislogique
source