Après avoir demandé des éclaircissements sur les coefficients du modèle linéaire ici, j'ai une question de suivi concernant les coefficients de niveaux de facteur non significatifs (valeur p élevée).
Exemple: si mon modèle linéaire comprend un facteur à 10 niveaux et que seulement 3 de ces niveaux ont des valeurs de p significatives qui leur sont associées, lors de l'utilisation du modèle pour prédire Y, puis-je choisir de ne pas inclure le terme de coefficient si le sujet tombe dans l'un des le niveau non significatif?
Plus radicalement, serait-il mal de regrouper les 7 niveaux non significatifs en un seul niveau et de ré-analyser?