Je crois que des effets comme ceux-ci sont souvent causés par la colinéarité (voir cette question ). Je pense que le livre sur la modélisation à plusieurs niveaux de Gelman et Hill en parle. Le problème est qu'il IV1
est corrélé avec un ou plusieurs des autres prédicteurs, et lorsqu'ils sont tous inclus dans le modèle, leur estimation devient erratique.
Si le retournement de coefficient est dû à la colinéarité, il n'est pas vraiment intéressant de le signaler, car il n'est pas dû à la relation entre vos prédicteurs et le résultat, mais vraiment à la relation entre les prédicteurs.
Ce que j'ai vu suggéré pour résoudre ce problème est la résidualisation. Tout d'abord, vous ajustez un modèle pour IV2 ~ IV1
, puis prenez les résidus de ce modèle comme rIV2
. Si toutes vos variables sont corrélées, vous devriez vraiment toutes les résidualiser. Vous pouvez choisir de faire comme ça
rIV2 <- resid(IV2 ~ IV1)
rIV3 <- resid(IV3 ~ IV1 + rIV2)
rIV4 <- resid(IV4 ~ IV1 + rIV2 + rIV3)
Maintenant, ajustez le modèle final avec
DV ~ IV1 + rIV2 + rIV3 + rIV4
Maintenant, le coefficient de rIV2
représente l'effet indépendant de IV2
étant donné sa corrélation avec IV1
. J'ai entendu dire que vous n'obtiendrez pas le même résultat si vous résidualisez dans un ordre différent, et que le choix de l'ordre de résidualisation est vraiment une question de jugement dans votre recherche.