Si le Hosmer-Lemeshow indique un manque d'ajustement mais l'AIC est le plus bas de tous les modèles .... devriez-vous toujours utiliser le modèle?
Si je supprime une variable, la statistique Hosmer-Lemeshow n'est pas significative (ce qui signifie qu'il n'y a pas de manque brutal d'ajustement). Mais l'AIC augmente.
Edit : Je pense qu'en général, si les AIC de différents modèles sont proches (c'est-à-dire ) les uns des autres, alors ils sont fondamentalement les mêmes. Mais les AIC sont très différents. Cela semble indiquer que celui avec l'AIC le plus bas est celui que je devrais utiliser même si le test Hosmer-Lemeshow indique le contraire.
Peut-être que le test HL ne s'applique qu'aux grands échantillons? Il a une faible puissance pour les petits échantillons (ma taille d'échantillon est ~ 300). Mais si j'obtiens un résultat significatif ... Cela signifie que même avec une faible puissance, j'obtiens un rejet.
Cela ferait-il une différence si j'utilisais l'AICc contre l'AIC? Comment obtenez-vous les AICc dans SAS? Je sais qu'il pourrait y avoir des problèmes de multiplicité. Mais a priori, je fais l'hypothèse que les variables ont un effet sur le résultat.
Des commentaires?
Edit2 : Je pense que je devrais utiliser le modèle avec une variable de moins et l'AIC supérieur avec HL non significatif. La raison en est que deux des variables sont corrélées entre elles. Il est donc logique de s'en débarrasser.