Mon calcul comporte plusieurs covariables pour un modèle, et toutes ne sont pas statistiquement significatives. Devrais-je enlever ceux qui ne le sont pas?
Cette question traite du phénomène, mais ne répond pas à ma question: comment interpréter l'effet non significatif d'une covariable dans ANCOVA?
Rien dans la réponse à cette question ne suggère que des covariables non significatives soient supprimées, bien que, pour le moment, je suis enclin à croire qu'elles devraient rester. Avant même de lire cette réponse, je pensais la même chose, car une covariable peut encore expliquer une partie de la variance (et donc aider le modèle) sans nécessairement expliquer un montant supérieur à un seuil (le seuil de signification, que je considère comme non applicable aux covariables).
Il y a une autre question quelque part sur le CV pour laquelle la réponse semble impliquer que les covariables devraient être conservées indépendamment de leur importance, mais ce n'est pas clair à ce sujet. (Je veux faire un lien vers cette question, mais je n'ai pas été en mesure de la retrouver à l'instant.)
Alors ... Les covariables qui ne sont pas statistiquement significatives doivent-elles être conservées dans le calcul du modèle? (J'ai édité cette question pour préciser que les covariables ne sont jamais dans la sortie du modèle par le calcul.)
Pour ajouter à la complication, que se passe-t-il si les covariables sont statistiquement significatives pour certains sous-ensembles de données (sous-ensembles devant être traités séparément). Par défaut, je garderais une telle covariable, sinon il faudrait utiliser des modèles différents ou une covariable statistiquement significative serait manquante dans l'un des cas. Si vous avez également une réponse pour ce cas fractionné, veuillez toutefois le mentionner.