Résidus dans la régression du poisson


9

Zuur 2013 Beginners Guide to GLM & GLMM suggère de valider une régression de Poisson en traçant les résidus de Pearsons par rapport aux valeurs ajustées. Zuur déclare que nous ne devrions pas voir les résidus se dissiper à mesure que les valeurs ajustées augmentent, comme le tracé attaché (dessiné à la main).

Mais j'ai pensé qu'une caractéristique clé de la distribution de Poisson est que la variance augmente à mesure que la moyenne augmente. Ne devrions-nous donc pas nous attendre à voir une variation croissante des résidus à mesure que les valeurs ajustées augmentent?

entrez la description de l'image ici

Réponses:


25

La distinction est claire dès que vous comprenez ce qu'est un résidu Pearson.

Vous avez raison de dire que pour un modèle de Poisson, la variance augmente à mesure que la moyenne augmente.

Par conséquent, les résidus bruts ordinaires ( ) devraient avoir un écart qui augmente avec les valeurs ajustées (mais pas en proportion).ri=yiμ^i

Cependant, les résidus de Pearson sont des résidus divisés par la racine carrée de la variance selon le modèle ( pour un modèle de Poisson). Cela signifie que si le modèle est correct, les résidus de Pearson devraient avoir une dispersion constante.riP=yiμ^iμ^i

Tracés résiduels d'un modèle de régression de Poisson simulé simple.  Graphique de gauche: les résidus bruts par rapport à la moyenne ajustée montrent un écart croissant avec la moyenne.  Il y a des "bandes" diagonales dans les résidus parce que les données sont discrètes.  Graphique de droite: les résidus de Pearson montrent ce qui ressemble à un écart constant sous forme de changements moyens, et les bandes diagonales sont maintenant courbes.


Pourriez-vous expliquer pourquoi vous écrivez que nous divisons par la racine carrée de la variance alors que vous divisez réellement par la racine carrée de la valeur attendue? Je sais que la variance est égale à la moyenne pour une distribution de poisson, mais c'est une constante pour une distribution particulière, alors de quelle variance parlons-nous ici?
kdarras

1
La distribution conditionnelle de la réponse peut être différente pour chaque combinaison de prédicteurs. D'où l'utilisation de l'indice sur la moyenne; est la moyenne de la population (et donc aussi la variance de la population) pour l'observation , étant donné ses valeurs prédictives (les valeurs de ses IV). μii
Glen_b -Reinstate Monica
En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.