Comme je l'ai expliqué dans mon commentaire sur votre autre question, step
utilise AIC plutôt que les valeurs p.
Cependant, pour une seule variable à la fois, AIC ne correspondent à l' aide d' une valeur p de 0,15 (ou pour être plus précis, 0,1573):
Envisagez de comparer deux modèles, qui diffèrent par une seule variable. Appelez les modèles (modèle plus petit) et (modèle plus grand), et laissez leur AIC être et respectivement.M 1 AIC 0 AIC 1M0M1AIC0AIC1
En utilisant le critère AIC, vous utiliseriez le modèle plus grand si . Ce sera le cas si . - 2 log L 0 - ( - 2 log L 1 ) > 2AIC1< AIC0- 2 bûchesL0- ( - 2 journauxL1) > 2
Mais il s'agit simplement de la statistique d'un test de rapport de vraisemblance. D'après le théorème de Wilks, nous rejetterons la valeur nulle si la statistique dépasse le quantile supérieur d'un . Donc, si nous utilisons un test d'hypothèse pour choisir entre le modèle plus petit et le plus grand, nous choisissons le modèle plus grand lorsque .χ 2 1 - 2 log L 0 - ( - 2 log L 1 ) > C ααχ21−2logL0−(−2logL1)>Cα
Maintenant, se situe au 84,27 centile d'un . Par conséquent, si nous choisissons le modèle plus grand lorsqu'il a un AIC plus petit, cela correspond au rejet de l'hypothèse nulle pour un test du terme supplémentaire avec une valeur de p de , ouχ 2 1 1 - 0,843 = 0,157 15,7 %2χ211−0.843=0.15715.7%
Alors, comment le modifiez-vous?
Facile. Modifiez le k
paramètre step
de 2 à autre chose. Vous voulez 10% à la place? Faites-en 2,7:
qchisq(0.10,1,lower.tail=FALSE)
[1] 2.705543
Vous voulez 2,5%? Ensemble k=5
:
qchisq(0.025,1,lower.tail=FALSE)
[1] 5.023886
etc.
Cependant, même si cela résout votre question, je vous conseille de prêter une attention particulière à la réponse de Frank Harrell sur votre autre question, et de rechercher ici les réponses d'un grand nombre de statisticiens sur d'autres questions relatives à la régression pas à pas, dont les conseils ont tendance à être très systématiquement pour éviter les procédures par étapes en général.