J'ai un modèle linéaire classique, avec 5 régresseurs possibles. Ils ne sont pas corrélés entre eux et ont une corrélation assez faible avec la réponse. Je suis arrivé à un modèle où 3 des régresseurs ont des coefficients significatifs pour leur statistique t (p <0,05). L'ajout de l'une des deux variables restantes ou des deux donne des valeurs de p> 0,05 pour la statistique t, pour les variables ajoutées. Cela m'amène à croire que le modèle à 3 variables est "le meilleur".
Cependant, en utilisant la commande anova (a, b) dans R où a est le modèle à 3 variables et b est le modèle complet, la valeur p pour la statistique F est <0,05, ce qui me dit de préférer le modèle complet à la variable 3 modèle. Comment concilier ces contradictions apparentes?
Merci PS Edit: quelques informations supplémentaires. Ce sont des devoirs donc je ne publierai pas de détails, mais on ne nous donne pas de détails sur ce que les régresseurs représentent - ils sont juste numérotés de 1 à 5. On nous demande de "dériver un modèle approprié, en donnant une justification".