Degrés de liberté résiduels appropriés après suppression des termes d'un modèle

Je réfléchis à la discussion autour de cette question et en particulier au commentaire de Frank Harrell selon lequel l'estimation de la variance dans un modèle réduit (c'est-à-dire à partir duquel un certain nombre de variables explicatives ont été testées et rejetées) devrait utiliser les degrés de liberté généralisés de Ye . Le professeur Harrell souligne que cela sera beaucoup plus proche des degrés de liberté résiduels du modèle original "complet" (avec toutes les variables) que de celui d'un modèle final (dont un certain nombre de variables ont été rejetées).

Question 1. Si je veux utiliser une approche appropriée pour tous les résumés et statistiques standard d'un modèle réduit (mais sans une mise en œuvre complète des degrés de liberté généralisés), une approche raisonnable consisterait-elle à simplement utiliser les degrés de liberté résiduels de le modèle complet dans mes estimations de la variance résiduelle, etc.?

Question 2. Si ce qui précède est vrai et que je veux le faire, cela Rpourrait-il être aussi simple que de définir

finalModel$df.residual <- fullModel$df.residual

à un moment donné de l'exercice d'ajustement du modèle, où finalModel et fullModel ont été créés avec lm () ou une fonction similaire. Après quoi, des fonctions telles que summary () et confint () semblent fonctionner avec le df.residual souhaité, bien que renvoyant un message d'erreur que quelqu'un a clairement contourné avec l'objet finalModel.

r regression model-selection regression-strategies

— Peter Ellis
source

Bonne question. Cela est lié à la raison pour laquelle Douglas Bates n'inclut pas de valeurs de p dans la lmersortie. Voir son raisonnement ici .

J'ai vu le modèle complet df utilisé dans une telle situation plus d'une fois. (L'approche de Ye revient souvent dans différentes situations; c'est un document que je me recommande régulièrement aux gens. Ce serait bien d'avoir une fonction R générique mais efficace dont de nombreuses fonctions pourraient tirer parti.)

— Glen_b -Reinstate Monica

Êtes-vous en désaccord avec la réponse de @ FrankHarrel selon laquelle la parcimonie s'accompagne de vilains compromis scientifiques, de toute façon?

J'adore le lien fourni dans le commentaire de @ MikeWiezbicki vers la justification de Doug Bates. Si quelqu'un n'est pas d'accord avec votre analyse, il peut le faire à sa façon, et c'est une façon amusante de lancer une discussion scientifique sur vos hypothèses de base. Une valeur p ne fait pas de votre conclusion une "vérité absolue".

$n<p$

— egbutter
source

+1 et je suis maintenant enclin à convenir qu'en fait ma question initiale n'est pas si importante compte tenu de ces autres problèmes

— Peter Ellis