Je réfléchis à la discussion autour de cette question et en particulier au commentaire de Frank Harrell selon lequel l'estimation de la variance dans un modèle réduit (c'est-à-dire à partir duquel un certain nombre de variables explicatives ont été testées et rejetées) devrait utiliser les degrés de liberté généralisés de Ye . Le professeur Harrell souligne que cela sera beaucoup plus proche des degrés de liberté résiduels du modèle original "complet" (avec toutes les variables) que de celui d'un modèle final (dont un certain nombre de variables ont été rejetées).
Question 1. Si je veux utiliser une approche appropriée pour tous les résumés et statistiques standard d'un modèle réduit (mais sans une mise en œuvre complète des degrés de liberté généralisés), une approche raisonnable consisterait-elle à simplement utiliser les degrés de liberté résiduels de le modèle complet dans mes estimations de la variance résiduelle, etc.?
Question 2. Si ce qui précède est vrai et que je veux le faire, cela R
pourrait-il être aussi simple que de définir
finalModel$df.residual <- fullModel$df.residual
à un moment donné de l'exercice d'ajustement du modèle, où finalModel et fullModel ont été créés avec lm () ou une fonction similaire. Après quoi, des fonctions telles que summary () et confint () semblent fonctionner avec le df.residual souhaité, bien que renvoyant un message d'erreur que quelqu'un a clairement contourné avec l'objet finalModel.
lmer
sortie. Voir son raisonnement ici .