Comment utiliser anova pour comparer deux modèles?


9

Comment dois-je comprendre le anovarésultat lors de la comparaison de deux modèles?

Exemple:

  Res.Df    RSS Df Sum of Sq      F    Pr(>F)    
1      9 54.032                                  
2      7  4.632  2      49.4 37.329 0.0001844 ***

La page de manuel indique: "Calculez l'analyse des tables de variance (ou de déviance) pour un ou plusieurs objets de modèle ajustés." Cependant, notre professeur a mentionné qu'il pourrait être utilisé pour la comparaison de modèles - c'est ce que j'ai l'intention de faire.

Par conséquent, je suppose que je pourrais utiliser anova(model1, model2)et obtenir une valeur de p qui me dit si je dois rejeter l'hypothèse nulle: "les modèles sont les mêmes".

Puis-je déclarer que si la valeur de p est inférieure à (disons) 0,05, les modèles diffèrent considérablement?


Dans votre exemple, les modèles 1 et 2 sont-ils imbriqués? Autrement dit, les deux modèles ont-ils un ensemble partagé de variables prédictives et la même variable de résultat, mais un modèle a une ou plusieurs variables prédictives supplémentaires?
EdM

L'un est comme Y ~ X + X^2et le secondY ~ X + X^2 + X^3
Petrbel

Réponses:


13

En supposant que vos modèles sont imbriqués (c.-à-d. La même variable de résultat et le modèle 2 contient toutes les variables du modèle 1 plus 2 variables supplémentaires), les résultats de l'ANOVA indiquent que les 2 variables supplémentaires représentent conjointement suffisamment de variance pour que vous puissiez rejeter l'hypothèse nulle selon laquelle la les coefficients des deux variables sont égaux à 0. C'est effectivement ce que vous avez dit. Si les deux coefficients sont égaux à 0, les modèles sont les mêmes.

Model1:y=a+bx1+cx2+dx3;Model2:y=a+bx1+cx2x3car::Anovaanova


Si je vous ai bien compris, la valeur de p inférieure à 0,05 prouve que les modèles diffèrent, serrés?
petrbel

3
Je n'utiliserais pas ces mots (c'est-à-dire "prouver" et "modèles différents"), mais nous voulons dire la même chose. Je dirais que vos données ne supportent pas l'hypothèse nulle que les coefficients sont tous les deux 0 ou que les données supportent l'hypothèse alternative que les coefficients ne sont pas tous les deux 0.
le_andrew

1
Avant d'affirmer que les modèles s'avèrent différents ou que l'hypothèse nulle n'est pas prise en charge, assurez-vous que les données satisfont raisonnablement aux hypothèses de l'ANOVA qui sous-tendent le calcul et l'interprétation des valeurs de p.
EdM

Pour être sûr, la dernière partie sur la somme des carrés de type I ne s'applique qu'à la situation où anova()est utilisé sur un modèle?
Jasper
En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.