En fait, je suis en train de passer en revue un manuscrit où les auteurs comparent 5 à 6 modèles de régression logit et AIC. Cependant, certains modèles comportent des termes d'interaction sans inclure les termes de covariable individuels. Cela a-t-il un sens de faire cela?
Par exemple (non spécifique aux modèles logit):
M1: Y = X1 + X2 + X1*X2
M2: Y = X1 + X2
M3: Y = X1 + X1*X2 (missing X2)
M4: Y = X2 + X1*X2 (missing X1)
M5: Y = X1*X2 (missing X1 & X2)
J'ai toujours eu l'impression que si vous avez le terme d'interaction X1 * X2, vous avez également besoin de X1 + X2. Par conséquent, les modèles 1 et 2 conviendraient, mais les modèles 3 à 5 seraient problématiques (même si la valeur AIC est inférieure). Est-ce correct? Est-ce une règle ou plus d'une ligne directrice? Quelqu'un at-il une bonne référence qui explique le raisonnement derrière cela? Je veux juste m'assurer que je ne communique rien d'important dans l'examen.
Merci pour vos pensées, Dan
:
c'est pour les interactions, comme dans A: B. Et *
est à la fois pour les effets principaux et les interactions, donc A * B = A + B + A: B. Donc, si (!) Les auteurs du document suivent cette notation, je ne pense pas qu’un des modèles manque les principaux effets?