Est-il toujours valable d'inclure une interaction bidirectionnelle dans un modèle sans inclure les effets principaux? Et si votre hypothèse ne concerne que l'interaction, avez-vous encore besoin d'inclure les principaux effets?
Est-il toujours valable d'inclure une interaction bidirectionnelle dans un modèle sans inclure les effets principaux? Et si votre hypothèse ne concerne que l'interaction, avez-vous encore besoin d'inclure les principaux effets?
Réponses:
Selon mon expérience, non seulement il est nécessaire d’avoir tous les effets d’ordre inférieur dans le modèle quand ils sont connectés à des effets d’ordre supérieur, mais il est également important de modéliser correctement (par exemple, permettre la non-linéarité) des effets principaux qui ne semblent pas liés à les facteurs dans les interactions d'intérêt. En effet, les interactions entre et x 2 peuvent être des substituts des principaux effets de x 3 et x 4 . Les interactions semblent parfois nécessaires car elles sont colinéaires avec des variables omises ou des termes non linéaires omis (par exemple, spline).
Vous demandez si c'est jamais valide. Permettez-moi de vous donner un exemple commun, dont l'élucidation peut vous suggérer des approches analytiques supplémentaires.
L’exemple le plus simple d’interaction est un modèle avec une variable dépendante et deux variables indépendantes X , Y sous la forme
avec une variable aléatoire à long terme ayant espérance nulle, et en utilisant des paramètres alpha , β ' , γ ' , et δ ' . Il est souvent utile de vérifier si δ ′ se rapproche de β ′ γ ′ , car une expression algébriquement équivalente du même modèle est
(où , etc.).
D' où, s'il y a une raison de supposer , on peut l' absorber dans le terme d'erreur ε . Cela donne non seulement une "interaction pure", mais également sans terme constant. Cela suggère fortement de prendre des logarithmes. Une certaine hétéroscédasticité dans les résidus, c'est-à-dire une tendance des résidus associés à des valeurs plus grandes de Z à être plus grandes en valeur absolue que la moyenne, irait également dans cette direction. Nous voudrions alors explorer une formulation alternative
avec iid erreur aléatoire . De plus, si nous nous attendons à ce que β X et γ Y soient grands par rapport à 1 , nous proposerons simplement le modèle
Ce nouveau modèle n'a qu'un seul paramètre au lieu de quatre paramètres ( α , β ′ , etc.) soumis à une relation quadratique ( δ ′ = β ′ γ ′ ), une simplification considérable.
Je ne dis pas que c'est une étape nécessaire, voire la seule, mais je suggère que ce type de réarrangement algébrique du modèle vaut généralement la peine d'être envisagé chaque fois que des interactions seules semblent être significatives.
Les chapitres 10 à 13 de l' EDA de Tukey contiennent d' excellents moyens d'explorer des modèles avec interaction, en particulier avec seulement deux et trois variables indépendantes .
Bien que les manuels scolaires disent souvent qu'il ne faut jamais inclure une interaction dans un modèle sans les effets principaux correspondants, il existe certainement des exemples où cela serait parfaitement logique. Je vais vous donner l'exemple le plus simple que je puisse imaginer.
Supposons que les sujets assignés au hasard à deux groupes soient mesurés deux fois, une fois au début (juste après la randomisation) et une fois après le groupe T, recevant un traitement quelconque, contrairement au groupe C. Ensuite, un modèle de mesures répétées pour ces données inclurait un effet principal pour une occasion de mesure (une variable muette égale à 0 pour la référence et 1 pour le suivi) et un terme d'interaction entre le groupe factice du groupe (0 pour C, 1 pour T ) et le mannequin de temps.
L'interception du modèle estime ensuite le score moyen des sujets au départ (quel que soit le groupe dans lequel ils se trouvent). Le coefficient pour le mannequin de mesure indique le changement de groupe témoin entre la base et le suivi. Et le coefficient du terme d'interaction indique l'ampleur de la modification dans le groupe de traitement par rapport au groupe de contrôle.
Ici, il n'est pas nécessaire d'inclure l'effet principal pour le groupe, car au départ, les groupes sont équivalents par définition en raison de la randomisation.
On pourrait bien sûr faire valoir que l’effet principal pour le groupe devrait toujours être inclus, de sorte que, si la randomisation échouait, cela serait révélé par l’analyse. Toutefois, cela revient à tester les moyennes de référence des deux groupes. Et il y a beaucoup de gens qui s'inquiètent après avoir testé les différences de base dans les études randomisées (bien sûr, il y en a aussi beaucoup qui trouvent cela utile, mais c'est un autre problème).
La raison pour conserver les principaux effets dans le modèle est identifiabilité. Par conséquent, si le but est d'inférence statistique sur chacun des effets, vous devez conserver les effets principaux dans le modèle. Cependant, si votre objectif de modélisation est uniquement de prédire de nouvelles valeurs, il est parfaitement légitime de n'inclure que l'interaction si cela améliore la précision prédictive.
c’est implicite dans de nombreuses réponses données par d’autres, mais le point simple est que les modèles avec un terme de produit mais avec le modérateur et le prédicteur ne sont que des modèles différents. Déterminez ce que chacun signifie en fonction du processus que vous modélisez et si un modèle sans modérateur / prédicteur est plus logique compte tenu de votre théorie ou de votre hypothèse. L'observation que le terme produit est significatif mais que lorsque le modérateur et le prédicteur ne sont pas inclus ne vous dit rien (sauf peut-être que vous pêchez pour "l'importance") sans une explication convaincante de la raison pour laquelle il est logique de les laisser de côté. .
On peut dire que cela dépend de l'utilisation que vous faites de votre modèle. Mais je n'ai jamais vu de raison de ne pas utiliser et décrire des modèles avec des effets principaux, même dans les cas où l'hypothèse ne concerne que l'interaction.
J'emprunterai un paragraphe du livre Une introduction à l'analyse de survie à l'aide de Stata de M.Cleves, R.Gutierrez, W.Gould, Y.Marchenko, édité par Stata Press, pour répondre à votre question.
Il est courant de lire que les effets d'interaction ne doivent être inclus dans le modèle que lorsque les effets principaux correspondants sont également inclus, mais il n'y a rien de mal à inclure des effets d'interaction eux-mêmes. [...] Le but d'un chercheur est de paramétrer ce qui est raisonnablement vraisemblable pour les données tenant compte du problème rencontré et non pas simplement suite à une ordonnance.
Les deux x et y seront en corrélation avec xy (sauf si vous avez pris une mesure spécifique pour éviter cela en utilisant le centrage). Ainsi, si vous obtenez un effet d'interaction substantiel avec votre approche, cela équivaudra probablement à un ou plusieurs effets principaux se faisant passer pour une interaction. Cela ne produira pas de résultats clairs et interprétables. Ce qui est souhaitable, c'est plutôt de voir à quel point l'interaction peut expliquer au-delà des effets principaux, en incluant x , y et (de préférence dans une étape ultérieure) xy .
En ce qui concerne la terminologie: oui, β 0 est appelée "constante". D'autre part, "partiel" a des significations spécifiques dans la régression et je ne voudrais donc pas utiliser ce terme pour décrire votre stratégie ici.
Quelques exemples intéressants qui apparaîtront une fois dans une lune bleue sont décrits à ce fil .
Je suggérerais que c'est simplement un cas particulier d'incertitude de modèle. D'un point de vue bayésien, vous traitez simplement cela de la même manière que vous traiteriez tout autre type d'incertitude, soit:
C'est très rarement une bonne idée d'inclure un terme d'interaction sans les effets principaux impliqués. David Rindskopf du CCNY a rédigé des articles sur ces rares cas.
Il existe divers processus dans la nature qui impliquent uniquement un effet d'interaction et des lois qui les décrivent. Par exemple, la loi d'Ohm. En psychologie, vous avez par exemple le modèle de performance de Vroom (1964): Performance = Capacité x Motivation. Maintenant, vous pouvez vous attendre à trouver un effet d'interaction significatif lorsque cette loi est vraie. Malheureusement, ce n'est pas le cas. Vous pouvez facilement trouver deux effets principaux et un effet d’interaction non significatif (pour une démonstration et une explication plus détaillée, voir Landsheer, van den Wittenboer et Maassen (2006), Social Science Research 35, 274-294). Le modèle linéaire ne convient pas très bien à la détection d'effets d'interaction. Ohm n'a peut-être jamais trouvé sa loi lorsqu'il utilisait des modèles linéaires.
En conséquence, l'interprétation des effets d'interaction dans les modèles linéaires est difficile. Si vous avez une théorie qui prédit un effet d'interaction, vous devez l'inclure, même lorsqu'elle est insignifiante. Vous voudrez peut-être ignorer les effets principaux si votre théorie les exclut, mais vous trouverez cela difficile, car des effets principaux significatifs se retrouvent souvent dans le cas d'un véritable mécanisme de génération de données qui n'a qu'un effet multiplicatif.
Ma réponse est la suivante: oui, il peut être valide d’inclure une interaction bidirectionnelle dans un modèle sans inclure les effets principaux. Les modèles linéaires sont d'excellents outils pour estimer les résultats d'une grande variété de mécanismes de génération de données, mais leur formule ne peut pas être facilement interprétée comme une description valide du mécanisme de génération de données.
Celui-ci est délicat et m'est arrivé dans mon dernier projet. Je l’expliquerais ainsi: supposons que les variables A et B soient significatives de manière indépendante et que, d’un point de vue commercial, vous pensiez qu’une interaction entre A et B semblait bonne. Vous avez inclus l'interaction qui s'est révélée significative, mais B a perdu sa signification. Vous expliqueriez votre modèle au départ en montrant deux résultats. Les résultats montreraient qu'initialement B était significatif mais que vu à la lumière de A, il a perdu son éclat. Donc, B est une bonne variable, mais seulement à la lumière de divers niveaux de A (si A est une variable catégorique). C'est comme dire qu'Obama est un bon chef lorsqu'il est vu à la lumière de son armée SEAL. Donc, le sceau Obama * sera une variable significative. Mais Obama, vu seul, pourrait ne pas être aussi important. (Aucune offense à Obama, juste un exemple.)
F = m * a, la force est égale à la masse multipliée par l'accélération.
Il n'est pas représenté sous la forme F = m + a + ma ou une autre combinaison linéaire de ces paramètres. En effet, seule l'interaction entre la masse et l'accélération aurait un sens physique.
Est-il toujours valable d'inclure une interaction à double sens sans effet principal?
Oui, cela peut être valable et même nécessaire. Si, par exemple, dans 2. vous incluez un facteur pour l'effet principal (différence moyenne entre l'état bleu et le rouge), cela aggravera le modèle.
Et si votre hypothèse ne concerne que l'interaction, avez-vous encore besoin d'inclure les principaux effets?
Votre hypothèse peut être vraie indépendamment de l’effet principal. Mais le modèle en aura peut-être besoin pour décrire le processus sous-jacent. Alors oui, vous devriez essayer avec et sans.
Remarque: Vous devez centrer le code pour la variable indépendante "continue" (mesure dans l'exemple). Sinon, les coefficients d'interaction dans le modèle ne seront pas distribués symétriquement (pas de coefficient pour la première mesure dans l'exemple).
Si les variables en question sont catégoriques, alors inclure des interactions sans les effets principaux n'est qu'un reparamétrage du modèle, et le choix du paramétrage dépend de ce que vous essayez d'accomplir avec votre modèle. L'interaction de variables continues avec d'autres variables continues ou avec des variables catégorielles est une tout autre histoire. Voir: voir cette FAQ de l'institut UCLA pour la recherche et l'éducation numériques
Oui, cela peut être valable, bien que ce soit rare. Mais dans ce cas, vous devez encore modéliser les principaux effets, que vous régresserez ensuite.
En effet, dans certains modèles, seule l’interaction est intéressante, comme les tests de médicaments / les modèles cliniques. C’est par exemple la base du modèle d’interactions psycho-physiologiques généralisées (IPPG): y = ax + bxh + ch
où x/y
sont les voxels / régions d’intérêt et h
les conceptions de bloc / événements.
Dans ce modèle, les deux a
et c
seront régressés, seuls b
seront retenus pour l'inférence (les coefficients bêta). En effet, à la fois a
et c
représentent une activité parasite dans notre cas, et ne b
représente ce qui ne peut être expliquée par une activité parasite, l'interaction avec la tâche.
La réponse courte: Si vous incluez l'interaction dans les effets fixes, les effets principaux sont automatiquement inclus, que vous les incliniez ou non dans votre code. . La seule différence est votre paramétrisation, c'est-à-dire la signification des paramètres dans votre modèle (par exemple, s'agit-il de moyennes de groupe ou de différences par rapport aux niveaux de référence)
sont des facteurs (catégoriques).
Je viens de voir que David Beede a fourni une réponse très similaire (excuses), mais je pensais que je laisserais cela en place pour ceux qui répondent bien à une perspective d'algèbre linéaire.