Quand quelqu'un dit que la déviance résiduelle / df devrait ~ 1 pour un modèle de Poisson, quelle est approximative approximative?


16

J'ai souvent vu les conseils pour vérifier si un ajustement du modèle de Poisson est trop dispersé, ce qui implique de diviser la déviance résiduelle par les degrés de liberté. Le rapport résultant doit être "environ 1".

La question est de savoir de quelle plage parlons-nous pour "approximative" - ​​quel est le ratio qui devrait déclencher des alarmes pour envisager d'autres formes de modèle?


2
Pas une réponse à cette question intéressante, mais ce que je vais souvent faire, c'est exécuter plusieurs modèles (par exemple Poissson, NB, peut-être des versions gonflées à zéro) et les comparer - à la fois sur des mesures de type AIC et sur des valeurs prédites.
Peter Flom - Réintègre Monica

Ce lien pourrait être intéressant. Surtout la section "Critères d'évaluation de la qualité de l'ajustement".

@Procrastinator Le lien est un exemple parfait de ce dont je parle: "Ensuite, si notre modèle correspond bien aux données, le rapport de la déviance à DF, Value / DF, devrait être d'environ un. Les valeurs de ratio élevées peuvent indiquer le modèle erreur de spécification ou variable de réponse sur-dispersée; des ratios inférieurs à un peuvent également indiquer une erreur de spécification du modèle ou une variable de réponse sous-dispersée. " Quelle est la gamme de "environ 1"? 0,99 à 1,01? 0,75 à 2?
Fomite

r-bloggers.com/… a également quelques informations sur la façon de répondre à cette question, bien que la réponse de @ StasK la couvre suffisamment bien.
vole

Réponses:


14

10 est grand ... 1,01 ne l'est pas. Puisque la variance de a χk2 est de 2k (voir Wikipedia ), l'écart-type de a χk2 est 2k , et celle deχk2/kest2/k . C'est votre bâton de mesure: pourχ1002 , 1,01 est pas grande, mais 2 est grande (7 sds loin). Pourχ10,0002 , 1.01 est OK, mais 1.1 n'est pas (7 sds loin).


1
"donc a un écart type de χk2/k "pouvez-vous me diriger vers un endroit qui le démontre s'il vous plaît?2/k
baxx

amazon.com/… . Désolé d'être un connard, mais c'est une distribution de référence dans l'inférence statistique; si vous ne le comprenez pas, vous ne devriez pas travailler avec des modèles linéaires généralisés tels que Poisson.
StasK

2
Pour référence future, vous pouvez, au lieu du préfixe / des excuses sur le fait d'être un connard, indiquer simplement les informations et une référence. Cela vous éviterait probablement de taper et vous ferait apparaître moins un connard, ce qui pourrait être une expérience nouvelle.
baxx

Voir edit et la référence wikipedia. J'ai proposé quelques centaines de réponses en quelques années, donc j'avoue qu'il est un peu difficile pour moi d'avoir une expérience vraiment nouvelle.
StasK

7

Asymptotiquement, la déviance doit être distribuée en chi carré avec une moyenne égale aux degrés de liberté. Donc, divisez-le par ses degrés de liberté et vous devriez obtenir environ 1 si les données ne sont pas trop dispersées. Pour obtenir un test approprié, il suffit de rechercher la déviance dans les tableaux de chi carré - mais notez (a) que la distribution du chi carré est une approximation & (b) qu'une valeur élevée peut indiquer d'autres types de manque d'ajustement (c'est peut-être pourquoi «environ 1» est considéré comme suffisant pour les travaux du gouvernement).

En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.